UNIVERSIDADE PRESBITERIANA MACKENZIEESCOLA DE ENGENHARIAENGENHARIA ELEacuteTRICA
BIANCA GALVAtildeO SCATAMACCHIA
AacuteUDIO DIGITAL EM SISTEMAS DE TV
SAtildeO PAULO2006
BIANCA GALVAtildeO SCATAMACCHIA
AacuteUDIO DIGITAL EM SISTEMAS DE TV
Trabalho de Graduaccedilatildeo Interdisciplinarapresentado ao Curso de Engenharia Eleacutetricada Escola de Engenharia da UniversidadePresbiteriana Mackenzie como requisitoparcial agrave obtenccedilatildeo do grau de Bacharel emEngenharia
ORIENTADOR PROFESSOR DOUTOR MARCIO EISENCRAFT
SAtildeO PAULO2006
AGRADECIMENTOS
A Deus fonte de toda sabedoria pela forccedila e coragem que me concedeu permanecendopresente em todo o percurso desta caminhada
A todos que contribuiacuteram de forma direta ou indireta na execuccedilatildeo deste trabalho
Ao Professor Marcio Eisencraft pelo constante acompanhamento comentaacuterios e sugestotildeesque enriqueceram o conteuacutedo deste trabalho
Soacute se realiza quem troca suas queixas por atitudes ousadas
(Jorge Forbes)
RESUMO
Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos
Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG
ABSTRACT
Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility
Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
BIANCA GALVAtildeO SCATAMACCHIA
AacuteUDIO DIGITAL EM SISTEMAS DE TV
Trabalho de Graduaccedilatildeo Interdisciplinarapresentado ao Curso de Engenharia Eleacutetricada Escola de Engenharia da UniversidadePresbiteriana Mackenzie como requisitoparcial agrave obtenccedilatildeo do grau de Bacharel emEngenharia
ORIENTADOR PROFESSOR DOUTOR MARCIO EISENCRAFT
SAtildeO PAULO2006
AGRADECIMENTOS
A Deus fonte de toda sabedoria pela forccedila e coragem que me concedeu permanecendopresente em todo o percurso desta caminhada
A todos que contribuiacuteram de forma direta ou indireta na execuccedilatildeo deste trabalho
Ao Professor Marcio Eisencraft pelo constante acompanhamento comentaacuterios e sugestotildeesque enriqueceram o conteuacutedo deste trabalho
Soacute se realiza quem troca suas queixas por atitudes ousadas
(Jorge Forbes)
RESUMO
Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos
Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG
ABSTRACT
Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility
Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
AGRADECIMENTOS
A Deus fonte de toda sabedoria pela forccedila e coragem que me concedeu permanecendopresente em todo o percurso desta caminhada
A todos que contribuiacuteram de forma direta ou indireta na execuccedilatildeo deste trabalho
Ao Professor Marcio Eisencraft pelo constante acompanhamento comentaacuterios e sugestotildeesque enriqueceram o conteuacutedo deste trabalho
Soacute se realiza quem troca suas queixas por atitudes ousadas
(Jorge Forbes)
RESUMO
Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos
Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG
ABSTRACT
Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility
Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
Soacute se realiza quem troca suas queixas por atitudes ousadas
(Jorge Forbes)
RESUMO
Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos
Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG
ABSTRACT
Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility
Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
RESUMO
Atualmente tem-se presenciado grandes avanccedilos tecnoloacutegicos na aacuterea de Engenharia deTelecomunicaccedilotildees com impactos transformadores no panorama das comunicaccedilotildees em todo omundo Um desses avanccedilos eacute a televisatildeo de alta definiccedilatildeo que eacute estruturada em novastecnologias de compressatildeo digital de aacuteudio e viacutedeo que possibilitam transportar maisconteuacutedos Isto proporciona ao telespectador transmissotildees com melhor qualidade naapresentaccedilatildeo dos conteuacutedos de programaccedilatildeo a custos progressivamente mais baixos Estetrabalho tem por objetivo apresentar os padrotildees de aacuteudio digital nos sistemas de televisatildeodigital europeu americano e japonecircs Para melhorar a acessibilidade do material eacute feita umarevisatildeo teoacuterica sobre aspectos baacutesicos das teacutecnicas de processamento de sinais envolvidos
Palavras-chave Aacuteudio digital Televisatildeo Amostragem Conversatildeo QuantizaccedilatildeoCompressatildeo MPEG
ABSTRACT
Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility
Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
ABSTRACT
Currently we have witnessed great technological advances in the area of TelecommunicationsEngineering with transforming impacts on the communications all over the world One ofthese advances is the High Definition Television (HDTV) that is structuralized in newtechnologies of audio and video digital compression making possible to carry more contentsThe HDTV provides transmissions with better quality in the presentation of the programmingcontents with gradually costs lower This work has as objective to present the audio digitalsystems in the European American and Japanese digital television standards We reviewbasic aspects of digital signal processing techniques involved to increase acesssibility
Word-key Audio digital Television Sampling Conversion Quantization CompressionMPEG
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
LISTA DE ILUSTRACcedilOtildeES
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997) 12Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005) 13Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia 14Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005) 15Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997) 17Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000) 18Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)19Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade 19Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo 21Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits 21Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004) 23Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000) 23Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004) 24Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000) 26Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000) 26Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000) 27Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)31Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005) 35Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001) 36Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000) 45Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000) 45Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC 50Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB 50Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB 51
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
LISTA DE SIGLAS
AD Analoacutegico DigitalAAC Advanced Audio CodingAES Audio Engineering SocietyATSC Advanced Television System CommiteeBC Backward CompatibleBPM Biphase Mark EncodCOFDM Coded Orthogonal Frequency Division MultiplexingDA Digital AnaloacutegicoDAB Digital Aacuteudio BroadcastingDBS Direct-to-home Broadcast SatelliteDVB Digital Video BroadcastingEBU European Broadcasting UnionFM Frequency ModulationFPB Filtro Passa-baixasHDTV High Definition TelevisionHiFi High FidelityIEC International Electrotechnical OrganizationISDB Integrated Service Digital BroadcastingISDN Integrated Service Digital NetworkISO International Organization for StandardizationLFE Low Frequency EnhancementMDCT Modified Discrete Cosine TransformMPEG Moving Picture Experts GroupNRZ Non retun-to-zeroPAM Pulse Amplitude ModulationPCM Pulse Code ModulationSBTVD Sistema Brasileiro de Televisatildeo DigitalSDI Signal Digital InterfaceSMR Signal to Mask RatioSNR Signal to Noise RatioVSB Vestigial Side Band
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
SUMAacuteRIO
1 INTRODUCcedilAtildeO 72 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL 921 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL 922 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL 11221 Filtragem anti-Aliasing 12222 Amostragem 13223 Sample and Hold 16224 Quantizaccedilatildeo 17225 Codificaccedilatildeo Sistema PCM 2223 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO 223 INTERFACES DIGITAIS DE AacuteUDIO 2531 SINAL BPM - BIPHASE MARK-ENCODED 2532 PROTOCOLO AESEBU 2633 SINCRONIZACcedilAtildeO DO AacuteUDIO 28331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo 2834 MULTICANAL 29341 Reduccedilatildeo da Taxa de Bits 30342 Aacuteudio Embedded 314 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV 3341 MPEG SISTEMA EUROPEU 33411 Modelo Psico acuacutestico 34412 MPEG - 1 364121Layer I 384122Layer II394123Layer III40413 MPEG-2 414131MPEG-2 AAC4242 DOLBY AC-3 SISTEMA AMERICANO 43421 Normalizaccedilatildeo do Sistema de Volume 475 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES DE
TV DIGITAL 496 CONCLUSOtildeES 52REFEREcircNCIAS 54
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
7
1 INTRODUCcedilAtildeO
A televisatildeo aberta brasileira eacute livre e gratuita constituindo-se numa fonte de
entretenimento e informaccedilatildeo do povo brasileiro e contribuindo decisivamente para garantir a
defesa do idioma a integraccedilatildeo nacional e o exerciacutecio da cidadania Por sua importacircncia
mereceu tratamento constitucional diferenciado dos demais meios de comunicaccedilatildeo tendo sido
definida como Comunicaccedilatildeo Social (NASCIMENTO 2002)
Nesse ambiente a televisatildeo aberta estaacute intimamente associada ao sistema de
transmissatildeo digital que seraacute adotado e que deve oferecer na tecnologia digital capacidade de
recepccedilatildeo do sinal com antenas interna e externa bem como aplicaccedilotildees diferenciadas aos
telespectadores
Os benefiacutecios da tecnologia da TV Digital incluem a capacidade de
proporcionar qualidade de imagem e som consideravelmente superior assim como maior
quantidade e diversidade de programaccedilatildeo de viacutedeo e toda uma nova gama de serviccedilos de
informaccedilatildeo inclusive uma capacidade interativa que ajudaraacute a trazer de maneira mais
completa os benefiacutecios da era da informaccedilatildeo aos cidadatildeos brasileiros
O aacuteudio digital eacute um dos alicerces da implantaccedilatildeo da televisatildeo digital no
Brasil jaacute que natildeo seria viaacutevel tal evoluccedilatildeo baseada em aacuteudio analoacutegico Assim a
conceituaccedilatildeo e os fundamentos do aacuteudio digital satildeo de extrema importacircncia para as emissoras
de televisatildeo e pessoas envolvidas com viacutedeo Desta forma justifica-se um trabalho de
graduaccedilatildeo interdisciplinar sobre este assunto
O capiacutetulo dois deste trabalho trata os fundamentos de sistemas de aacuteudio
digital a conversatildeo AD amostragem quantizaccedilatildeo 1 codificaccedilatildeo PCM e conversatildeo DA
No capiacutetulo trecircs abordam-se as interfaces digitais de aacuteudio como
sincronizaccedilatildeo e multicanal O capiacutetulo quatro trata dos os sistemas europeu americano e
japonecircs de compressatildeo de sinais de aacuteudio para televisatildeo digital de alta definiccedilatildeo (HDTV
1 A palavra quantizaccedilatildeo apesar de natildeo constar nos principais dicionaacuterios da liacutengua foi utilizada em funccedilatildeo de seu sentidoconsagrado
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
8
High Definition Television) Por fim as conclusotildees da monografia satildeo expressas no Capiacutetulo
5
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
9
2 TEORIA BAacuteSICA DE SISTEMAS DE AacuteUDIO DIGITAL
Para se transformar um sinal sonoro em sinal digital adequado ao
processamento por equipamentos digitais eacute necessaacuterio convertecirc-lo da forma analoacutegica (o
sinal eleacutetrico de um microfone por exemplo) para o formato digital isto eacute coacutedigos numeacutericos
que podem ser interpretados por processadores
Os transdutores padrotildees de aacuteudio os microfones e alto-falantes satildeo
componentes analoacutegicos Para integraccedilatildeo destes componentes ao ambiente digital necessita-
se fazer as chamadas conversotildees analoacutegico-digital (AD) e digital-analoacutegico (DA) (ROBIN
2000)
O processo de representaccedilatildeo digital eacute composto basicamente de duas etapas A
primeira eacute a amostragem e quantizaccedilatildeo que compotildeem a conversatildeo analoacutegico-digital
geralmente resultando em um grande nuacutemero de bits e a segunda eacute a compressatildeo utilizada
para reduziacute-lo diminuindo as necessidades de memoacuteria e de capacidade do canal de
comunicaccedilatildeo (LATHI 1998)
A seguir seratildeo analisadas vantagens da utilizaccedilatildeo do aacuteudio digital os
princiacutepios da conversatildeo AD amostragem e quantizaccedilatildeo
21 VANTAGENS DA UTILIZACcedilAtildeO DO AacuteUDIO DIGITAL
Os sistemas de aacuteudio digital necessitam de uma menor relaccedilatildeo sinal-ruiacutedo
(SNR signal to noise ratio) em relaccedilatildeo a sistemas que utilizam aacuteudio analoacutegico com mesma
qualidade de recepccedilatildeo devido agrave quantizaccedilatildeo dos possiacuteveis valores que chegam ao receptor A
comunicaccedilatildeo digital eacute mais eficiente na multiplexaccedilatildeo de diferentes sinais digitais e na
realizaccedilatildeo de troca de SNR por largura de banda utilizada (LATHI 1998)
Uma outra vantagem do aacuteudio digital eacute que com uma quantizaccedilatildeo de 16 bits
teoricamente pode-se alcanccedilar uma variaccedilatildeo dinacircmica de 96 dB comparado a menos de 80
dB dos melhores sistemas analoacutegicos (IAZZETTA 2005) Com relaccedilatildeo agrave variaccedilatildeo dinacircmica
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
10
cada bit acrescentado na resoluccedilatildeo dobra o nuacutemero de passos (ou valores) usados para
representar a variaccedilatildeo de amplitude da onda e com isso adiciona 6dB na escala de dinacircmica
como mostrado na Tabela 1 Resoluccedilotildees mais altas oferecem tambeacutem maior relaccedilatildeo sinal
ruiacutedo
A resoluccedilatildeo da amplitude eacute dada por n2 em que n eacute o nuacutemero de bits A
extensatildeo dinacircmica por sua vez eacute representada por
2log20)2log(20 nn (1)
Tabela 1 Relaccedilatildeo entre resoluccedilatildeo de amplitude e extensatildeo dinacircmica (IAZZETTA 2005)
A implementaccedilatildeo do hardware digital eacute flexiacutevel permitindo o uso de
microprocessadores e de circuitos integrados em larga escala Aleacutem disso sinais digitais
podem ser codificados de forma a reduzir taxas de erro (LATHI 1998)
Outro fator a que se deve a superioridade de sistemas digitais em oposiccedilatildeo aos
analoacutegicos eacute a viabilidade de repetidores regenerativos do sinal original transmitido Estaccedilotildees
repetidoras podem ser colocadas ao longo do caminho da comunicaccedilatildeo do sistema digital a
certas distacircncias suficientes para garantir que ruiacutedos e distorccedilotildees permaneccedilam dentro do
limite Em cada estaccedilatildeo repetidora os pulsos que chegam satildeo detectados e novos pulsos
limpos satildeo transmitidos para a proacutexima estaccedilatildeo Este processo previne a acumulaccedilatildeo de
ruiacutedos e distorccedilotildees ao longo do caminho da comunicaccedilatildeo pela regeneraccedilatildeo perioacutedica dos
pulsos nas estaccedilotildees repetidoras
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
11
Nos sistemas analoacutegicos ao contraacuterio distorccedilotildees e ruiacutedos satildeo acumulados
resultando numa SNR diminuiacuteda continuamente ao longo da transmissatildeo No caso analoacutegico
natildeo eacute possiacutevel a regeneraccedilatildeo do sinal Pode-se apenas amplificaacute-lo poreacutem o ruiacutedo tambeacutem eacute
amplificado de forma que a SNR permanece na melhor das hipoacuteteses quase a mesma quando
o sinal eacute amplificado
Apesar das inuacutemeras vantagens da utilizaccedilatildeo do aacuteudio digital ele apresenta
algumas desvantagens A primeira delas eacute a dificuldade de sincronizaccedilatildeo entre a conversatildeo
AD e a referecircncia de viacutedeo jaacute que a duraccedilatildeo do intervalo vertical de viacutedeo natildeo corresponde
ao valor da duraccedilatildeo do bloco de aacuteudio causando perda de sincronismo (ROBIN 2000)
Outras desvantagens satildeo a dificuldade de monitoraccedilatildeo do aacuteudio digital (quando
embedded ou seja o aacuteudio inserido no viacutedeo explicado na Seccedilatildeo 342) a dificuldade de
substituiccedilatildeo e inversatildeo de canais e o custo elevado do sistema devido agrave necessidade de um
grande nuacutemero de multiplexadores e demultiplexadores ao longo do processo de conversatildeo
AD e DA
22 PRINCIacutePIOS DA CONVERSAtildeO ANALOacuteGICO-DIGITAL
A compreensatildeo dos princiacutepios da conversatildeo AD eacute de fundamental importacircncia
para a concepccedilatildeo de projetos e aplicaccedilotildees de sistemas digitais (LUTHER 1997)
A conversatildeo AD amostra um sinal analoacutegico a cada periacuteodo de amostragem
(T ) gerando um sinal de tempo discreto Em seguida este sinal eacute quantizado gerando uma
sequumlecircncia de dados digitais que representam as amplitudes do sinal (LUTHER 1997)
Aleacutem desta caracteriacutestica a conversatildeo AD eacute executada geralmente por
circuitos integrados sendo composta no miacutenimo por quatro etapas mostradas na Ilustraccedilatildeo 1
(LUTHER 1997)
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
12
Ilustraccedilatildeo 1 Diagrama de blocos da conversatildeo AD (LUTHER 1997)
A primeira etapa eacute a filtragem anti-aliasing que remove as frequumlecircncias acima
da frequumlecircncia de Nyquist evitando o efeito aliasing como eacute discutido na Seccedilatildeo 221 Em
seguida ocorre a amostragem responsaacutevel pela conversatildeo da escala de tempo contiacutenuo para
tempo discreto A terceira etapa eacute a quantizaccedilatildeo na qual ocorre a divisatildeo do eixo de tensatildeo
em valores discretos finitos Por fim tem-se a codificaccedilatildeo que define siacutembolos para cada um
dos niacuteveis de quantizaccedilatildeo
Na praacutetica a amostragem a quantificaccedilatildeo e a codificaccedilatildeo podem ser feitas por
um uacutenico circuito eletrocircnico natildeo necessariamente nesta ordem e ateacute simultaneamente
221 Filtragem anti-Aliasing
De acordo com o Teorema de Nyquist a quantidade de amostras por unidade
de tempo de um sinal chamada taxa ou frequumlecircncia de amostragem amf deve ser maior que o
dobro da maior frequumlecircncia contida no sinal a ser amostrado para que possa ser reproduzido
integralmente sem erro de aliasing (LATHI 1998)
max2 ff am (2)
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
13
O inverso da frequumlecircncia de amostragem amf
T 1 eacute chamado de periacuteodo de
amostragem A metade da frequumlecircncia de amostragem eacute chamada de frequumlecircncia de Nyquist e
corresponde ao limite maacuteximo de frequumlecircncia do sinal que pode ser reproduzido Como natildeo eacute
possiacutevel garantir que o sinal natildeo contenha componentes acima deste limite eacute necessaacuterio filtrar
o sinal com um filtro passa-baixas com frequumlecircncia de corte igual (ou menor) agrave frequumlecircncia de
Nyquist (LUTHER1997)
A filtragem anti-aliasing eacute realizada por um filtro passa-baixas com resposta
impulsiva )(nhd que tem ganho unitaacuterio e frequumlecircncia de corte c como mostrado na
Ilustraccedilatildeo 2 Ele eacute usado antes da conversatildeo AD para que nenhuma frequumlecircncia acima de 2amf
esteja presente no sinal provocando aliasing (COSTA 2005)
0
1)(
ccT
H Cd
(3)
Apesar deste filtro ser ideal na praacutetica toma-se )(dH pequeno para
T minimizando a distorccedilatildeo de aliasing
Ilustraccedilatildeo 2 Minimizaccedilatildeo do efeito alising pelo filtro anti-aliasing (COSTA 2005)
222 Amostragem
A amostragem (ou sampling) consiste na medida da amplitude de uma forma
de onda analoacutegica em intervalos perioacutedicos (HAYKIN 2000)
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
14
No domiacutenio da frequumlecircncia muacuteltiplos da frequumlecircncia de amostragem amf (ou
carrier) aparecem com suas proacuteprias bandas laterais Isto ocorre porque o carrier natildeo eacute um
sinal senoidal mas sim uma seacuterie de pulsos na frequumlecircncia de amostragem Este tipo de sinal eacute
representado no domiacutenio da frequumlecircncia por uma seacuterie de componentes de frequumlecircncia muacuteltiplas
da frequumlecircncia de amostragem (ROBIN 2000)
A Ilustraccedilatildeo 3 representa a transformada do processo de amostragem no
domiacutenio do tempo no domiacutenio da frequumlecircncia na qual ocorre a convoluccedilatildeo de dois sinais
resultando num terceiro sinal
Ilustraccedilatildeo 3 Processo de amostragem na frequumlecircncia
Para que natildeo ocorra aliasing os espectros da Ilustraccedilatildeo 3 natildeo podem se
sobrepor Assim deve-se ter
MM T2
M
T
max2
1
ff am
max2 ff am (4)
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
15
Por exemplo suponha que um sinal de voz tenha uma frequumlecircncia maacutexima de
4000 Hz A frequumlecircncia de amostragem deveraacute ser entatildeo maior do que 8000 Hz ou seja cada
segundo desta voz seraacute representado por 8000 amostras Um sinal de aacuteudio com frequumlecircncia
maacutexima igual a 20000 Hz deveraacute ter uma amostragem com taxa maior do que 40000 Hz (que
corresponde a 40000 amostras por segundo)
O circuito que permite amostrar o sinal eacute uma simples chave que se fecha por
um curto periacuteodo na frequumlecircncia de amostragem Por exemplo se a frequumlecircncia de amostragem
for de 8 kHz a chave se fecha 8000 vezes por segundo ou seja a cada 125 s Como a chave
se fecha por um tempo extremamente curto teremos na sua saiacuteda um sinal em forma de
pulsos estreitos com amplitude igual ao valor instantacircneo do sinal chamados pulsos
modulados em amplitude (ou PAM Pulse Amplitude Modulation) A Ilustraccedilatildeo 4
exemplifica o principio da amostragem (COSTA 2005)
Ilustraccedilatildeo 4 Princiacutepio de amostragem de sinal (COSTA 2005)
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
16
O sinal de amostragem tambeacutem chamado funccedilatildeo amostra eacute constituiacutedo de
impulsos com a frequumlecircncia de amostragem amf O espectro deste sinal conteacutem raias nas
frequumlecircncias muacuteltiplas inteiras de amf ou seja 0 Hz (componente continua) amf 2 amf 3 amf
4 amf
A frequumlecircncia de amostragem determina a largura de banda e a taxa de bits do
sistema de acordo com a seguinte expressatildeo (LUTHER 1997)
Taxa bit (bit rate) = amostra
bitsf am (5)
Os trecircs padrotildees de frequumlecircncias de amostragem para o aacuteudio satildeo (ROBIN 2000)
a) 32 kHz Usado como padratildeo de transmissatildeo profissional
b) 441 kHz Usado como padratildeo de consumo Selecionada para permitir o uso de
videotapes equipados com adaptadores PCM para gravaccedilatildeo e reproduccedilatildeo de aacuteudio
digital Aplicaccedilatildeo principalmente em CD de aacuteudio (compact disc)
c) 48 kHz Padratildeo de aacuteudio para broadcast Eacute relacionada com a frequumlecircncia de 32 kHz e
facilita a conversatildeo de padratildeo
223 Sample and Hold
O circuito sample and hold eacute usualmente implementado para manter os valores
de amostras por tempo suficiente para a operaccedilatildeo de quantizaccedilatildeo nos mesmos Este circuito
mostrado na Ilustraccedilatildeo 5 captura as amostras pelo fechamento do comutador por um pequeno
periacuteodo de tempo para finalmente provocar a mudanccedila do capacitor ateacute o valor da amostra
Quando o comutador abre o capacitor manteacutem o valor da amostra ateacute o proacuteximo pulso de
amostragem (LUTHER 1997)
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
17
Ilustraccedilatildeo 5 Funcionamento do circuito Sample and Hold (LUTHER 1997)
224 Quantizaccedilatildeo
A quantizaccedilatildeo eacute o processo de conversatildeo de cada amostra da forma de onda
analoacutegica num valor digital discreto ou seja a representaccedilatildeo de valores numeacutericos quaisquer
(com precisatildeo ilimitada) utilizando um nuacutemero finito de bits Em outras palavras a
amostragem retira um nuacutemero de amostras do sinal de maneira que estas amostras passam a
representar o sinal Todavia os valores numeacutericos destas amostras devem ser representados
por um determinado nuacutemero de bits Isso impotildee uma limitaccedilatildeo no nuacutemero de valores
numeacutericos possiacuteveis para representar cada amostra (LUTHER 1997)
Por exemplo no caso de uma placa de som Sound Blasterreg da empresa
Creative (CREATIVE 2005) o som pode ser digitalizado com 16 bits por amostra Estes 16
bits permitem 162 = 65536 valores possiacuteveis A quantizaccedilatildeo consiste em transformar o valor
numeacuterico de cada amostra (obtida no processo de amostragem) em um dos 65536 valores
possiacuteveis neste caso
A quantizaccedilatildeo gera uma distorccedilatildeo conhecida como erro de quantizaccedilatildeo
mostrada na Ilustraccedilatildeo 6 Isto ocorre pois a quantizaccedilatildeo sempre arredonda (ou trunca) os
valores contiacutenuos do sinal analoacutegico introduz erros Ou seja durante o processo de
amostragem do valor do sinal analoacutegico as amostras poderatildeo cair entre dois niacuteveis de
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
18
quantizaccedilatildeo Neste caso o valor mais proacuteximo seraacute selecionado e o erro surgiraacute durante o
processo de recuperaccedilatildeo do sinal original (ROBIN 2000)
O erro de quantizaccedilatildeo poderaacute ser reduzido aumentando o nuacutemero de niacuteveis
discretos (aumentando o nuacutemero de bits) Ele pode ser baixo se o nuacutemero de niacuteveis de
quantizaccedilatildeo utilizados for elevado A definiccedilatildeo do nuacutemero de niacuteveis a ser utilizado eacute dado por
nQ 2 onde Q eacute o nuacutemero de niacuteveis e n eacute o nuacutemero de bits que seraacute utilizado para
representar cada amostra (LUTHER 1997)
Ilustraccedilatildeo 6 - Erro de quantizaccedilatildeo gerado pela quantizaccedilatildeo (ROBIN 2000)
A Ilustraccedilatildeo 7 ilustra um quantizador que utiliza 3 bits para cada amostra
Assim 3n e o nuacutemero de valores (niacuteveis) possiacuteveis para representar uma amostra seria
8Q (ou seja 32Q ) E estes 8 niacuteveis representam nuacutemeros de 0 a 7 Diz-se que este
quantizador tem um passo de quantizaccedilatildeo (tambeacutem chamado de degrau de quantizaccedilatildeo) de 1
pois esta eacute a diferenccedila entre os seus valores de saiacuteda Tambeacutem na Ilustraccedilatildeo 7 observa-se um
exemplo do processo de conversatildeo AD onde (a) representa o sinal analoacutegico original (b) os
pulsos de amostragem (c) as amostras e intervalos ou niacuteveis da quantizaccedilatildeo e (d) a sequumlecircncia
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
19
digitalizada Desta forma percebe-se que (b) e (c) representam o processo de amostragem
onde o eixo do tempo eacute dividido em intervalos fixos As amostras satildeo representadas por
valores discretos em cada intervalo de tempo gerando assim um conjunto de nuacutemeros
inteiros
Ilustraccedilatildeo 7 Quantizador representa o processo de conversatildeo AD (KLAUTAU JR 2004)
Considerando-se um intervalo de quantizaccedilatildeo de comprimento 1 o erro de
quantizaccedilatildeo de distribui uniformemente no intervalo 5050 Assim um graacutefico para
funccedilatildeo densidade de probabilidade ( )(ef E ) eacute mostrado na Ilustraccedilatildeo 8
Ilustraccedilatildeo 8 - Funccedilatildeo densidade de probabilidade
O valor meacutedio quadraacutetico do erro eacute dado entatildeo por
1
2
3
4
5
6
7
(b)
(a)
(c)
(d) 010 101 101 110010 100 110 010 001
Amplitude
Tempo
0
(010)
(000)
(001)
(011)
(100)
(101)
(110)
(111)
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
20
12150
50
22 deefe E (6)
Portanto o erro meacutedio de quantizaccedilatildeo de cada amostra eacute
12
1 (7)
Quanto agrave resoluccedilatildeo os conversores AD ou DA podem operar com 8 ou 16
bits de acordo com a qualidade desejada em termos de relaccedilatildeo sinalruiacutedo (SNR) de
quantizaccedilatildeo ou distorccedilatildeo harmocircnica
a) 8 bits permitem 256 valores discretos e uma SNR de quantizaccedilatildeo teoacuterica de
aproximadamente 48 dB (com quantizaccedilatildeo linear que representa intervalos iguais de
quantizaccedilatildeo) calculado a partir da funccedilatildeo de densidade de probabilidade originada pela
situaccedilatildeo mostrada na Ilustraccedilatildeo 8 para um valor escolhido de sinal de amplitude pico-a-pico
4 (valor escolhido para que a potecircncia do sinal seja 1) e 256 niacuteveis de quantizaccedilatildeo mostrado
na Ilustraccedilatildeo 9 Portanto o intervalo de erro de quantizaccedilatildeo eacute dado por
256
4
256
4
resultando na funccedilatildeo densidade da Ilustraccedilatildeo 10
Supondo que uma amostra eacute extraiacuteda do sinal e seu valor eacute 23 De acordo com
a Ilustraccedilatildeo 7 esta amostra seria representada por 010 que eacute associado ao valor 2 O erro de
quantizaccedilatildeo eacute dado pela diferenccedila entre o valor original e o valor quantizado 23 2 = 03
Desta forma o erro de quantizaccedilatildeo seria de 03 O erro quadraacutetico meacutedio como pocircde ser
analisado na Equaccedilatildeo 7 eacute obtido quando se eleva ao quadrado o erro de quantizaccedilatildeo de cada
amostra mostrado anteriormente na Equaccedilatildeo 6 e se tira a meacutedia dos valores obtidos
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
21
Ilustraccedilatildeo 9 - Representaccedilatildeo dos possiacuteveis niacuteveis de quantizaccedilatildeo
Ilustraccedilatildeo 10 - Funccedilatildeo densidade de probabilidade para 8 bits
A potecircncia de ruiacutedo para a funccedilatildeo da Ilustraccedilatildeo 10 eacute calculada por
14
1281
1281
22
23
164
dee (8)
Portanto como a 14
14
23
23
11
RUIDO
SINAL
PPSNR seu valor em dB eacute
dBdBSNR 9146)23log(10)( 14 (9)
justificando assim o valor de 48dB explicitado anteriormente
b) 16 bits permitem 65536 valores discretos e no maacuteximo 96 dB de SNR (caacutelculo semelhante
ao item a) Esta quantizaccedilatildeo eacute necessaacuteria para HiFi - High-Fidelity ou alta fidelidade - mas
geram arquivos maiores Haacute um compromisso praacutetico entre qualidade e tamanho dos arquivos
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
22
de som ou taxa de transmissatildeo destes arquivos Para um equipamento possuir a identificaccedilatildeo
Hi-Fi deve ser capaz de reproduzir todas as frequumlecircncias sonoras situadas entre 20 Hertz e 20
KHz
225 Codificaccedilatildeo Sistema PCM
Codificaccedilatildeo eacute o processo de atribuiccedilatildeo de siacutembolos digitais para os niacuteveis de
quantizaccedilatildeo (POHLMANN 2005) Eacute preciso codificar o sinal para poder melhor armazenaacute-lo
e transmiti-lo
O Pulse-Code Modulation (PCM) eacute um meacutetodo de conversatildeo de um sinal
analoacutegico em sinal digital (LATHI 1998) Eacute o sistema mais utilizado sendo padratildeo para CDs
e muacutesica em geral
O PCM eacute o sistema mais simples e mais utilizado em sistemas de codificaccedilatildeo
digital poreacutem natildeo eacute o de melhor eficiecircncia A largura de banda de um sinal de voz eacute em torno
de 15 kHz mas testes mostram que a inteligibilidade natildeo eacute afetada se todos os componentes
acima de 3400 Hz satildeo suprimidos Em sistemas PCM para voz em telefonia digital por
exemplo os componentes acima de 3400 Hz satildeo eliminados por um filtro passa baixas O
sinal resultante eacute entatildeo amostrado numa taxa de 8000 amostras por segundo (8 kHz) e 8
bitsamostra (256 valores possiacuteveis) Assim a taxa de bits necessaacuteria para o PCM aplicado agrave
telefonia eacute de 6400080008 bps Por isso o canal para telefonia digital eacute de 64 kbps por
exemplo usam 2 canais de 64 kbps (128 kbps) 8 canais de 64 (512 kbps) ou outros muacuteltiplos
de 64 (LATHI 1998)
23 PRINCIacutePIOS DA CONVERSAtildeO DIGITAL-ANALOacuteGICO
No conversor DA as palavras binaacuterias satildeo primeiramente decodificadas pelo
valor que elas representam e logo depois convertidas para a amplitude da tensatildeo
representativa do sinal de aacuteudio original (ROBIN 2000)
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
23
A conversatildeo AD pode causar erros se existirem transientes chamados de
glitches Portanto para evitar este efeito haacute um processo chamado re-amostragem
(resampling) apoacutes a conversatildeo para eliminar estes transientes (LUTHER 1997)
Na entrada do processo existe um circuito sample and hold para cada bit para
fazer esta re-amostragem para reduzir a largura dos pulsos (aperture ratio) e remover os
glitches (ROBIN 2000)
Ao final do processo um filtro passa baixas (tambeacutem chamado filtro de
reconstruccedilatildeo) visto na Ilustraccedilatildeo 11 eacute inserido para remover os mais altos harmocircnicos (acima
de 2Sf
) que satildeo adicionados ao longo do processo de amostragem (ROBIN 2000)
Ilustraccedilatildeo 11 Remoccedilatildeo de harmocircnicas pelo filtro de reconstruccedilatildeo (KLAUTAU JR 2004)
A Ilustraccedilatildeo 12 resume o processo de decodificaccedilatildeo PCM
Ilustraccedilatildeo 12 Diagrama de blocos da decodificaccedilatildeo PCM (ROBIN 2000)
Cada um dos valores de quantizaccedilatildeo eacute organizado em um periacuteodo de tempo
igual ao intervalo de amostragem resultando em uma seacuterie de sinais (a) amplitudes
quantizadas (b) reconstruccedilatildeo do sinal (c) sinal obtido apoacutes a filtragem do sinal em (b)
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
24
mostrados na Ilustraccedilatildeo 13 Portanto os valores quantizados satildeo determinados a partir de
valores de quantizaccedilatildeo
Ilustraccedilatildeo 13 - Conversatildeo DA e efeito da filtragem (KLAUTAU JR 2004)
Para a eliminaccedilatildeo da caracteriacutestica de escada na conversatildeo DA usa-se um
filtro passa-baixas que tem a funccedilatildeo de reconstruir o sinal A Ilustraccedilatildeo 13 ilustra o efeito da
filtragem que transforma o sinal ilustrado no item (b) em um sinal mais suave ilustrado no
item (c)
Uma observaccedilatildeo a ser feita eacute que usa-se a conversatildeo DA para reproduzir um
sinal armazenado na memoacuteria que busca os coacutedigos numeacutericos e respeitando a sua ordem
cronoloacutegica recria o sinal original ponto por ponto Para que o sinal seja reconstruiacutedo
corretamente eacute preciso que o conversor DA recoloque as amostragens ao longo do tempo
com a mesma velocidade que foi usada pelo conversor AD
(a) 010 101 101 110010 100 110 010 001
1
2
3
4
5
6
7
(b)
(c)
Amplitude
Tempo
0
(010)
(001)
(011)
(100)
(101)
(110)
(111)
(000)
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
25
3 INTERFACES DIGITAIS DE AacuteUDIO
31 SINAL BPM - BIPHASE MARK-ENCODED
A codificaccedilatildeo de canal (channel coding) eacute usada em sistemas de gravaccedilatildeo e
transmissatildeo digital para casar certas propriedades dos dados codificados com as
caracteriacutesticas do meio de transmissatildeo ou gravaccedilatildeo A codificaccedilatildeo de canal adapta os dados
originais para conseguir a maior densidade de bits possiacuteveis dentro das limitaccedilotildees do canal
(ROBIN 2000)
As caracteriacutesticas do canal de transmissatildeo resultam numa maior ou menor
frequumlecircncia de banda-base Este eacute o objetivo da codificaccedilatildeo de canal para manter a forma do
espectro de sinais digitais e minimizar as distorccedilotildees
Satildeo utilizadas diferentes formas de onda para codificaccedilatildeo de canal cada uma
com sua proacutepria aplicaccedilatildeo e limitaccedilatildeo A Audio Engineering Society (AES) juntamente com a
European Broadcasting Union (EBU) desenvolveram um padratildeo de transmissatildeo de aacuteudio
digital conhecido como padratildeo AESEBU ou tambeacutem AES3-1992
Importantes caracteriacutesticas dos coacutedigos satildeo dadas atraveacutes da comparaccedilatildeo entre
as formas de ondas codificadas pelo NRZ (Nonreturn-to-zero) ou pelo BPM (Biphase-mark)
vistas na Ilustraccedilatildeo 14
No coacutedigo NRZ zeros e uns satildeo transmitidos como niacuteveis positivo e
negativo e as transiccedilotildees ocorrem somente quando haacute mudanccedila na sequumlecircncia dos bits (ROBIN
2000) No coacutedigo BPM haacute uma transiccedilatildeo no iniacutecio de cada intervalo do bit e no meio de cada
um Consequentemente nunca haveraacute mais que dois uns ou zeros consecutivos Este
coacutedigo tambeacutem eacute chamado de Manchester-I muito usado para gravaccedilatildeo de time code em fitas
e codificaccedilatildeo do formato AESEBU (ROBIN 2000)
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
26
Ilustraccedilatildeo 14 - Forma de onda codificada em NRZ e BPM (ROBIN 2000)
Com relaccedilatildeo ao espectro do sinal pode-se dizer que para alta densidade na
transmissatildeo digital a escolha da modulaccedilatildeo de coacutedigo (code modulation) eacute muito importante
jaacute que o canal de transmissatildeo determina a escolha do coacutedigo Como se pode observar na
Ilustraccedilatildeo 15 o coacutedigo NRZ apresenta uma grande concentraccedilatildeo de energia em baixas
frequumlecircncias (ROBIN 2000)
Ilustraccedilatildeo 15 - Distribuiccedilatildeo da Densidade Espectral (ROBIN 2000)
32 PROTOCOLO AESEBU
Conhecido como AESEBU Standard o AESEBU eacute um protocolo de
interface padratildeo para equipamentos que trabalham com aacuteudio digital desenvolvida pela AES
juntamente com a EBU como jaacute dito anteriormente para permitir que os equipamentos
possam receber e transmitir sinais de aacuteudio digital (REIMERS 2001)
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
27
O diagrama de blocos simplificado da codificaccedilatildeo AESEBU eacute mostrado na Ilustraccedilatildeo 16 Os
sinais de dados agrave 48 kHz de taxa de amostragem teratildeo uma taxa total de dados
307248000232 Mbps (ou seja 32 sub-bandas de frequecircncia e 2 canais num tava de 48
kHz) Apoacutes a codificaccedilatildeo BPM e a inserccedilatildeo de cabeccedilalho a taxa de fluxo (data stream rate)
seraacute dobrado para aproximadamente 6144 Mbps (ROBIN 2000)
A estrutura do padratildeo AESEBU eacute composta em frames (quadro) e este
formado por dois subframes denominados subframe A e subframe B Os frames de aacuteudio satildeo
agrupados em blocos de 192 frames formando um bloco de aacuteudio A duraccedilatildeo do bloco de
aacuteudio eacute 2083 micros ou seja 148 kHz E portanto a duraccedilatildeo de um bloco de aacuteudio AESEBU eacute
40001928320 micros (REIMERS 2001 ROBIN 2000)
Ilustraccedilatildeo 16 - Diagrama de blocos da codificaccedilatildeo AESEBU (ROBIN 2000)
Com relaccedilatildeo agrave distribuiccedilatildeo do sinal de aacuteudio digital a recomendaccedilatildeo AES3-
1992 define que a distribuiccedilatildeo do sinal AESEBU deve se feita atraveacutes de cabo coaxial
(ROBIN 2000)
O AESEBU permite cabos com impedacircncia entre 88 ohms ateacute 132 ohms
sejam usados Cabos de aacuteudio padratildeo usados em instalaccedilotildees de aacuteudio analoacutegico tecircm
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
28
impedacircncia entre 40 e 70 ohms Com este descasamento o sinal digital poderaacute percorrer
curtas distacircncias neste tipo de cabo antes que reflexotildees comecem a degradar o sinal digital
Nas instalaccedilotildees de viacutedeo o mesmo cabo coaxial 75 ohms poderaacute ser usado
para o traacutefego dos sinais de aacuteudio digital Poreacutem se o equipamento natildeo possuir a saiacuteda
coaxial deve-se usar um adaptador de 110 ohms para 75 ohms
33 SINCRONIZACcedilAtildeO DO AacuteUDIO
Sinais de aacuteudio digital satildeo feitos de amostras discretas Mixagem inserccedilatildeo ou
ediccedilatildeo necessitam de uma sincronizaccedilatildeo das amostras em fase e frequumlecircncia por uma fonte
geradora de referecircncia (ROBIN 2000)
Dois equipamentos idecircnticos localizados no mesmo estuacutedio poderatildeo gerar
pequenos desvios nas saiacutedas caso natildeo estejam sincronizados
Da mesma forma como nas instalaccedilotildees de viacutedeo eacute recomendaacutevel utilizar um
gerador de referecircncia para perfeito sincronismo dos sinais de aacuteudio
331 Sincronizaccedilatildeo entre sinais digitais de aacuteudio e viacutedeo
No ambiente de televisatildeo a referecircncia do sinal de aacuteudio digital deve estar em
sincronismo com o sinal de referecircncia de viacutedeo para evitar o lip sync (efeito da imagem
atrasada ou adiantada em relaccedilatildeo ao seu aacuteudio) durante o chaveamento dos sinais (ROBIN
2000)
Em sistemas de TV de 625 linhas existe um nuacutemero exato de amostras de
aacuteudio por frame de viacutedeo 1920 amostras de aacuteudio para uma taxa de amostragem de 48 kHz
Jaacute num sistema de 525 linhas o nuacutemero de amostras de aacuteudio por frames de
viacutedeo natildeo eacute um nuacutemero inteiro mas sim um nuacutemero fracionaacuterio (80085) que pode ser obtido
pelo caacutelculo
61601833320
33366 amostras (10)
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
29
em que 33366 micros eacute a duraccedilatildeo do frame de viacutedeo e 208333 micros duraccedilatildeo do frame de aacuteudio
Apoacutes cinco frames de viacutedeo um nuacutemero inteiro de amostras de aacuteudio eacute obtido
8008561601 (11)
A Tabela 2 mostra a relaccedilatildeo entre o nuacutemero de amostras de aacuteudio por frames
de viacutedeo e a taxa de frames de viacutedeo para trecircs frequumlecircncias de amostragem mais utilizadas
Tabela 2 Relaccedilatildeo entre amostras de aacuteudio (ROBIN 2000)
34 MULTICANAL
Dois ou mais canais reproduzindo sons da mesma fonte com distribuiccedilatildeo
espacial provecircem uma reproduccedilatildeo mais realista pelo fato do ouvinte poder ter a sensaccedilatildeo de
diretividade do som ou seja a presenccedila do surround Apesar de muitos sistemas
multiplexarem canais de aacuteudio juntos por conveniecircncia de gravaccedilatildeo ou distribuiccedilatildeo o
objetivo eacute manter os canais independentes uns dos outros com apenas a mixagem dos canais
reproduzidos no espaccedilo onde o som estaacute sendo ouvido (LUTHER 1997)
A presenccedila de dois canais de aacuteudio num sistema chama-se esteacutereo (que pode
ser analoacutegico ou digital) e eacute frequumlentemente utilizada em gravaccedilotildees e sistemas broadcasting
de televisatildeo Os canais esquerdo (L = left) e direito (R = right) correspondem agraves localizaccedilotildees
dos alto-falantes para a reproduccedilatildeo Desta percepccedilatildeo de som espacial com mais de dois
canais de reproduccedilatildeo surge o princiacutepio de som surround que eacute um dos alicerces do HDTV
Este sistema provecirc 51 canais sendo cinco canais de aacuteudio em toda a largura de banda) e
um canal de baixas frequumlecircncias (subwoofer) considerado como 01 (LUTHER 1997)
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
30
Considerando o conceito de 51 canais o Dolby Digitalreg eacute uma avanccedilada
forma de codificaccedilatildeo de aacuteudio digital que possibilita a armazenagem e transmissatildeo de som
digital com alta qualidade e eficiecircncia Eacute o resultado de experiecircncias nos Laboratoacuterios Dolby
em processamento digital de sinais que exploram caracteriacutesticas da audiccedilatildeo humana
O Dolby Digital 51 (ou 5 + 1) canais proporciona cinco canais com variaccedilotildees
entre 20 Hz a 20 kHz esquerdo (L) direito (R) centro (C) esquerdo surround ( SL ) e direito
surround ( SR ) mais um sexto canal de efeitos de baixa frequumlecircncia (LFE low-frequency
enhancement ) tambeacutem conhecido como subwoofer que vai de 20 Hz a 120 Hz E cada canal
pode transportar simultaneamente um diferente sinal Como a largura de banda audiacutevel do
canal LFE eacute apenas um deacutecimo dos outros canais refere-se a ele como canal 01 (ROBIN
2000)
341 Reduccedilatildeo da Taxa de Bits
Uma das diferenccedilas entre os sistemas de televisatildeo analoacutegicos e digitais satildeo as
taxas dos sinais de aacuteudio e viacutedeo Estas taxas sofrem uma reduccedilatildeo no espectro de um total de
6 MHz no analoacutegico (ou 194 Mbps) a taxa de aacuteudio eacute reduzida de 48 Mbps para 384 kbps
(SPRATLING 1999)
Portanto uma compressatildeo eficiente eacute necessaacuteria para a longa duraccedilatildeo da
armazenagem do material e menores custos na distribuiccedilatildeo e transmissatildeo (ROBIN 2000)
A reduccedilatildeo da taxa de bits eacute tambeacutem uma forma de controlar e manobrar o
ruiacutedo de quantizaccedilatildeo Em sistemas com quantizaccedilatildeo linear 16 bits de resoluccedilatildeo eacute considerado
um nuacutemero de bits praacutetico miacutenimo para manter o ruiacutedo de quantizaccedilatildeo abaixo do niacutevel
aceitaacutevel (SPRATLING 1999)
A codificaccedilatildeo do fluxo de bits de aacuteudio eacute multiplexada com fluxos de viacutedeo e
fluxos auxiliares (ambos previamente codificados) para a obtenccedilatildeo do fluxo de aacuteudio final
visto na Ilustraccedilatildeo 17 Um tiacutepico sistema de sinais de aacuteudio digital (um canal) tem taxa de bits
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
31
de 768 kbps antes da compressatildeo Uma taxa de compressatildeo de 121 eacute aplicada para reduzir a
taxa de bits para 64 kbps Apoacutes a compressatildeo os seis canais de aacuteudio satildeo multiplexados em
384 kbps para a obtenccedilatildeo do fluxo de aacuteudio final (ROBIN 2000)
Portanto como caracteriacutesticas mais importantes para o sistema de 6 canais
tem-se 5 canais + um canal LFE cada canal eacute amostrado com frequumlecircncia de amostragem de
48 kHz resoluccedilatildeo das amostras de aacuteudio satildeo de 16 a 24 bits taxa de bits maacutexima de 384 kbps
para aacuteudio a ser multiplexado (ROBIN 2000)
Ilustraccedilatildeo 17 - Codificaccedilatildeo e multiplexaccedilatildeo de sinal de aacuteudio para TV digital (ROBIN 2000)
342 Aacuteudio Embedded
O aacuteudio digital AES pode trafegar independente do sinal de viacutedeo ou inserido
no sinal SDI (signal digital interface interface de sinal digital)
A vantagem de se utilizar o aacuteudio inserido no sinal SDI ou seja o aacuteudio
embedded eacute a possibilidade de embutir ou seja multiplexar de 2 a 16 canais de aacuteudio digital
no sinal de viacutedeo Esta opccedilatildeo eacute particularmente utilizada em grandes sistemas em que as vias
de aacuteudio digital se tornam consideraacuteveis em relaccedilatildeo ao custo e a garantia de que o aacuteudio estaacute
associado com o viacutedeo
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
32
Outra vantagem em se trabalhar com aacuteudio embedded eacute o fato deste permitir a
comutaccedilatildeo dos dois sinais simultaneamente em uma matriz serial digital SDI (routing
switcher) (BENSON 2002)
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
33
4 COMPRESSAtildeO DE SINAIS DE AacuteUDIO PARA HDTV
Os trecircs sistemas de televisatildeo digital existentes no mundo - o Advanced
Television System Committee (ATSC) americano o Digital Video Broadcasting (DVB)
europeu e o Integrated Service Digital Broadcasting (ISDB) japonecircs - consideram a
transmissatildeo de um sinal digital de aacuteudio submetido a processos de compressatildeo com grande
eficiecircncia Tem-se como objetivo a obtenccedilatildeo de sinais de aacuteudio com som de alto niacutevel de
fidelidade e naturalidade associados a taxas de bits adequadas para sistemas de televisatildeo de
alta definiccedilatildeo
Este capiacutetulo traz uma visatildeo geral dos sistemas de compressatildeo de aacuteudio para
HDTV nos sistemas europeu japonecircs e americano MPEG-2 MPEG-2 AAC e DOLBY AC-
3 respectivamente sendo de fundamental importacircncia uma explanaccedilatildeo sobre o MPEG-1 que
eacute a base do MPEG-2
41 MPEG SISTEMA EUROPEU
O MPEG (Moving Picture Experts Group) eacute um grupo teacutecnico que produz
normas para compressatildeo de viacutedeo e aacuteudio digitais reunidas no comitecirc da ISOIEC
(International Organization for Standardization International Electrotechnical
Organization) e subdivide-se em trecircs partes aacuteudio viacutedeo e sistemas (MPEG 2005) Deste
apenas o aacuteudio - o MPEGaacuteudio - referido apenas como MPEG seraacute abordado nesta
monografia
O MPEG define a sintaxe da sequumlecircncia de bits (bit-stream) de viacutedeo e aacuteudio
codificados a baixas taxas de bits e os meios para multiplexar sequumlecircncias de viacutedeo e aacuteudio
sincronamente em uma uacutenica sequumlecircncia de bits Os principais motivos da utilizaccedilatildeo de uma
codificaccedilatildeo em baixa taxa de bits jaacute vistos na seccedilatildeo 341 satildeo a necessidade de minimizar o
custo das transmissotildees e proporcionar um armazenamento eficiente (MPEG 2005)
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
34
O comitecirc MPEG trabalha em fases distintas identificadas por nuacutemeros
sequumlenciais (MPEG-1 MPEG-2 MPEG-4 entre outros) Este trabalho abordaraacute o MPEG-1 e
o MPEG-2 O primeiro foi desenvolvido para codificar sinais de aacuteudio em formatos mono e
esteacutereo Jaacute o segundo estabelece padrotildees apropriados para HDTV As diferenccedilas do MPEG-2
com relaccedilatildeo ao MPEG-1 satildeo a previsatildeo de cinco canais de aacuteudio (full bandwidth) mais um
canal de baixa frequumlecircncia (o canal LFE) vistos anteriormente na seccedilatildeo 34
Para haver uma compatibilidade entre os padrotildees MPEG-1 e MPEG-2 os
sinais dos cinco canais de aacuteudio satildeo combinados formando outros dois canais L0 e R0 numa
operaccedilatildeo denominada matrixing Nesta operaccedilatildeo o decodificador MPEG-1 interpretaraacute os
sinais L0 e R0 como sinais dos canais esquerdo e direito respectivamente decodificando-os
como sinal esteacutereo O MPEG-2 faraacute a operaccedilatildeo inversa (dematrixing) recuperando os cinco
canais originais As Equaccedilotildees 12 a 15 representam a transformaccedilatildeo para os canais L0 e R0 em
funccedilatildeo dos canais R L C SL e SR explicados anteriormente na Seccedilatildeo 34 (IANO et al
2000)
21
1
(12)
2 (13)
)(0 SLCLL (14)
)(0 SRCRR (15)
em que os fatores aacute acirc e auml satildeo atenuadores do sinal evitando sobrecarga (overload) no caacutelculo
do sinal esteacutereo compatiacutevel ( ) 00 RL
411 Modelo Psico acuacutestico
A compressatildeo de dados de aacuteudio feito pelo algoritmo MPEG remove em sua
maioria as partes acuacutesticas irrelevantes do sinal de aacuteudio em virtude da incapacidade do
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
35
sistema auditivo humano em notar o ruiacutedo de quantizaccedilatildeo em certas faixas de frequumlecircncias
(IANO et al 2000)
O limiar da audibilidade humana (L) eacute um niacutevel de pressatildeo do som
dependente da frequumlecircncia dado pela foacutermula (REIMERS 2001)
(16)
em que p representa a pressatildeo do som e 0p a referecircncia de pressatildeo (definida como Pa20 )
Para cada frequecircncia existe um limiar L a partir do qual ocorre um fenocircmeno
chamado mascaramento auditivo (IANO et al 2000) mostrado na Ilustraccedilatildeo 18 Este eacute uma
propriedade da audiccedilatildeo humana em mascarar componentes de baixa potecircncia na ocorrecircncia
simultacircnea de componentes de maior potecircncia localizados muito proacuteximos dentro do espectro
do sinal (PINHO 2005)
Ilustraccedilatildeo 18 Curva do mascaramento auditivo (PINHO 2005)
Portanto o objetivo do modelo psico-acuacutestico eacute a anaacutelise do sinal de aacuteudio de
entrada a determinaccedilatildeo da posiccedilatildeo no espectro na qual o sinal seraacute mascarado e a extensatildeo
log200p
pL
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
36
desse efeito de mascaramento O modelo descreve principalmente as caracteriacutesticas de
resposta em frequumlecircncia e resposta no tempo do sistema de audiccedilatildeo humana e fornece a
estrateacutegia de codificaccedilatildeo de modo que o ruiacutedo seja mascarado abaixo do limiar
412 MPEG - 1
O sistema de compressatildeo MPEG-1 trata-se de um algoritmo geneacuterico capaz de
codificar qualquer fonte de aacuteudio Tem a capacidade de manter a qualidade do sinal de aacuteudio
reproduzido no receptor com uma taxa de compressatildeo em torno de 5 para 1 o que equivale agrave
codificaccedilatildeo de uma amostra de aacuteudio com 3 bits por amostra (IANO et al 2000) O sistema
alcanccedila tais niacuteveis de compressatildeo alocando ruiacutedo de quantizaccedilatildeo nas sub-bandas onde o
ouvido humano apresenta menor sensibilidade
Desta forma o modelo psico-acuacutestico determina a partir do sinal de entrada o
niacutevel de ruiacutedo perceptiacutevel ou niacutevel de mascaramento para cada sub-banda resultante da
anaacutelise do banco de filtros
A estrutura baacutesica de um codificador de aacuteudio MPEG eacute mostrado na Ilustraccedilatildeo
19 (REIMERS 2001)
Ilustraccedilatildeo 19 - Estrutura baacutesica do codificador MPEG (REIMERS 2001)
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
37
Primeiramente o aacuteudio de entrada passa por um banco de filtros polifaacutesicos
que divide o sinal de entrada em 32 sub-bandas de frequumlecircncia com larguras de banda iguais
atraveacutes de um banco de filtros passa-faixa (IANO et al 2000) o que significa que a taxa de
amostragem eacute reduzida 32 vezes em relaccedilatildeo agrave parte da taxa de amostragem utilizada na
digitalizaccedilatildeo (REIMERS 2001) Poreacutem as 32 larguras de banda natildeo representam com
precisatildeo as bandas criacuteticas do ouvido humano E como natildeo eacute possiacutevel a construccedilatildeo de filtros
com resposta em frequumlecircncia perfeitamente plana na banda de passagem e zero na banda de
rejeiccedilatildeo o efeito de aliasing pode ser introduzido durante o processo de dizimaccedilatildeo resultando
em perda de informaccedilatildeo
De acordo com a Ilustraccedilatildeo 19 o aacuteudio de entrada passa simultaneamente
atraveacutes do banco de filtros e de um modelo psico-acuacutestico Este uacuteltimo determina como visto
na seccedilatildeo 411 a razatildeo da energia do sinal com relaccedilatildeo ao limiar de mascaramento de cada
sub-banda
O bloco de quantizaccedilatildeo usa a relaccedilatildeo sinalmascaramento (ou SMR signal to
mask ratio) para decidir como seraacute feita a divisatildeo do nuacutemero total de bits disponiacutevel na sub-
banda de sinal para minimizar a audiccedilatildeo do ruiacutedo de quantizaccedilatildeo (IANO et al 2000)
Por fim o bloco da formataccedilatildeo da sequumlecircncia de bits (bit-stream) utiliza a
representaccedilatildeo das amostras quantizadas em sub-banda e gera o bit-stream
Jaacute o decodificador decifra o bit-stream gerado pela codificaccedilatildeo restaura os
valores quantizados em sub-banda e reconstroacutei o sinal de aacuteudio a partir de valores da sub-
banda
Quanto agrave sua estrutura o codificador MPEG-1 utiliza um algoritmo de
alocaccedilatildeo de bits adaptativo ou seja o nuacutemero de bits alocados para cada amostra variam
frame a frame de acordo com o modelo psico-acuacutestico utilizado (IANO et al 2000)
Os modos em que a informaccedilatildeo a ser codificada podem ser mono ou esteacutereo O
modo mono trabalha apenas com um canal No formato esteacutereo a informaccedilatildeo pode ser
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
38
codificada em outros trecircs modos diferentes esteacutereo dual e joint esteacutereo (IANO et al 2000
ROBIN 2000) Nos modos esteacutereo e dual os dois canais satildeo transmitidos no mesmo frame
de forma independente sem a remoccedilatildeo de qualquer tipo de redundacircncia O esteacutereo eacute utilizado
para transmitir os canais esquerdo e direito nas aplicaccedilotildees broadcasting jaacute o dual para
transmitir diferentes tipos de informaccedilatildeo nos dois canais de aacuteudio O modo joint esteacutereo retira
a redundacircncia contida no formato esteacutereo broadcasting a fim de otimizar a codificaccedilatildeo
Dada a possibilidade aos fabricantes de equipamentos da escolha de diversos
paracircmetros (qualidade do aacuteudio transmitido seu tempo de processamento taxa de
transmissatildeo etc) surgiu a necessidade de se ter mais de um layer com o objetivo de adequar
a escolha dos paracircmetros citados aos custos de implementaccedilatildeo
Para cada layer a norma especifica o formato do bit-stream Os layers satildeo
autocircnomos e compatiacuteveis hierarquicamente ou seja o decodificador do layer III eacute capaz de
decodificar sequumlecircncias codificadas nos layers IIIII e I enquanto o layer II apenas decodifica
sequumlecircncias dos layers II e I (IANO et al 2000)
O MPEG-1 define trecircs camadas (layers) para a codificaccedilatildeo PCM oferecendo
as seguintes frequumlecircncias de amostragem 32 kHz 441 kHz e 48 kHz (ROBIN 2000) A
escolha da taxa de bits (em kbps) depende da qualidade do aacuteudio e do modo escolhidos
A diferenccedila baacutesica entre os layers eacute que a complexidade do
codificadordecodificador o atraso do codificadordecodificador e a eficaacutecia de codificaccedilatildeo
aumenta do layer I para o layer III
4121 Layer I
O layer I apresenta menor complexidade Atinge taxas de bits em torno de 384
kbpscanal Sua taxa total varia entre 32 e 448 kbps (IANO et al 2000)
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
39
Cada frame conteacutem as uacuteltimas 12 amostras dizimadas de cada uma das 32 sub-
bandas resultantes do banco de filtros Portanto sinal de entrada eacute dividido em frames que
conteacutem 384 amostras por canal
3841232 amostras (17)
A duraccedilatildeo do frame de aacuteudio para uma taxa de 48 kHz eacute
sk
T frame 832048
1 (18)
O comprimento do frame para uma taxa de amostragem de 48 kHz eacute
calculado pelo produto do nuacutemero de sub-bandas de frequumlecircncia pelo nuacutemero de amostras num
bloco pelo tempo de duraccedilatildeo da amostra (ROBIN 2000)
883201232 ms (19)
Possui um fator de escala de 6 bits por banda (120 dB) em que o fator de
escala eacute um nuacutemero utilizado para multiplicar a amostra requantizada de uma sub-banda)
Pode ser utilizado em um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Sua utilizaccedilatildeo eacute mais apropriada em aplicaccedilotildees como gravaccedilotildees e uso em
estuacutedios devido ao seu frame ter apenas 8 ms Por exemplo o Philips Digital Compact
Cassette (DCCreg) utiliza uma taxa de 192 kbps (ROBIN 2000)
4122 Layer II
O layer II melhora a performance do layer I permitindo uma compressatildeo
adicional Atinge taxas de bits em torno de 128 Kbpscanal Sua taxa total varia entre 32 e 384
kbps (ROBIN 2000)
Nesse formato de compressatildeo o frame consiste de 36 amostras por sub-banda
e eacute dividido em 3 partes e cada parte conteacutem 12 amostras por sub-banda (como no layer I)
Portanto o sinal de entrada eacute dividido em frames que conteacutem 1152 amostras por canal
11523632 amostras (20)
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
40
O comprimento do frame portanto para uma taxa de amostragem de 48 kHz eacute
calculado por
2483203384 ms (21)
Possui um fator de escala de 6 bits por banda (120 dB) e pode ser utilizado em
um ou dois canais sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute mais comum ser utilizado em CD-ROM Digital Video Broadcasting (DVB)
Digital Audio Broadcasting (DAB) Direct-to-home Broadcast Satellite (DBS) multimiacutedia
entre outros sistemas
4123 Layer III
Mais conhecido como MP3 o MPEG-1 layer III provecirc a melhor qualidade de
aacuteudio a baixas taxas de bits e alcanccedila maiores niacuteveis de compressatildeo Seu banco de filtros
proporciona uma alta resoluccedilatildeo de espectro e adapta resoluccedilotildees em tempo e frequumlecircncia para
melhor competir com diferentes sinais de entrada Atinge taxas de bits em torno de 64
kbpscanal e utiliza 576 bandas de frequecircncia Sua taxa total varia entre 32 e 320 kbps
(ROBIN 2000)
O banco de filtros eacute um filtro hiacutebrido o qual consiste de um filtro polifaacutesico e
um filtro MDCT (Modified Discrete Cosine Transform) para compensar a baixa precisatildeo do
banco de filtros melhorar a resoluccedilatildeo e manter a compatibilidade entre as camadas 1 e 2
(FRAUNHOFER IIS 2006)
O Modelo Perceptual eacute o principal responsaacutevel pela qualidade sonora obtida
pelo codificador MP3 Este modelo usa desde um banco de filtros separados para retirar os
valores mascarados por picos de amplitude do sinal A saiacuteda do modelo consiste nos valores
para o mascaramento ou valores de ruiacutedo permitidos para cada bloco de codificaccedilatildeo Se o
ruiacutedo de quantizaccedilatildeo ficar abaixo do valor de mascaramento o processo de compressatildeo teraacute
um resultado impossiacutevel de ser distinguido do sinal original (FRAUNHOFER IIS 2006)
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
41
Quanto ao comprimento do frame e ao nuacutemero de amostras por canal possui os
valores iguais ao do layer II Seus fatores de escala satildeo utilizados para modificar estrutura e
niacuteveis do ruiacutedo de quantizaccedilatildeo diferentemente dos layers I e II (ROBIN 2000)
Como nos dois casos anteriores pode ser utilizado em um ou dois canais
sendo o uacuteltimo esteacutereo ou joint esteacutereo
Eacute basicamente utilizado em aplicaccedilotildees com baixa taxa de bits como em
transmissotildees sobre sistemas Integrated Service Digital Network (ISDN) telecomunicaccedilotildees
links de sateacutelite e aacuteudio de alta qualidade na internet
413 MPEG-2
O MPEG-2 eacute uma evoluccedilatildeo do padratildeo MPEG-1 definido para necessidades de
novas utilizaccedilotildees como formato multicanal com taxas de bits superiores a 1 Mbps adequado
para aplicaccedilotildees HDTV qualidade de aacuteudio com baixas a altas taxas de bits (32 a 1066 kbps)
codificaccedilatildeo em 6 canais incluindo o canal de baixa frequumlecircncia (LFE)
O MPEG-2 oferece 3 frequumlecircncias de amostragem diferentes do MPEG-1 16
kHz 2205 kHz e 24 kHz Os formatos de compressatildeo utilizados pelos dois sistemas satildeo
praticamente os mesmos
No codificador MPEG-2 o par esteacutereo eacute transmitido como no MPEG-1 e os
canais adicionais satildeo enviados em campos de dados auxiliares da sintaxe MPEG-1 Um
decodificador MPEG-1 soacute poderaacute decodificar uma parte do sinal codificado por um
codificador MPEG-2 Essa compatibilidade recebe o nome de MPEG-2 BC (Backward
Compatible) Portanto a codificaccedilatildeo do frame de sincronizaccedilatildeo do sistema MPEG-2 BC
constitui uma extensatildeo do utilizado no MPEG-1 devido agrave utilizaccedilatildeo de um nuacutemero maior de
canais de aacuteudio Assim a formataccedilatildeo do frame MPEG-2 BC pode ser interpretada por
qualquer decodificador MPEG-1 Poreacutem o sistema MPEG-2 AAC (Advanced Audio Coding)
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
42
uma evoluccedilatildeo do MPEG-2 BC natildeo garante a compatibilidade com o sistema MPEG-1 mas
apresenta melhor desempenho do que o MPEG-2 (IANO et al 2000)
4131 MPEG-2 AAC
O padratildeo AAC (Advanced Audio Coding - codificaccedilatildeo avanccedilada de aacuteudio) eacute
um dos formatos de compressatildeo de aacuteudio definido pelo MPEG-2 poreacutem natildeo eacute compatiacutevel
com os padrotildees anteriores MPEG-1 e MPEG-2 BC
Possui taxas de amostragem entre 8 kHz e 96 kHz e codificaccedilatildeo de alta
qualidade com capacidade de ateacute 48 canais e 16 canais LFE Eacute superior ao MP3 pois possui
maior compressatildeo e definiccedilatildeo de aacuteudio para maiores taxas de amostragem
O AAC emprega basicamente as mesmas propriedades dos padrotildees anteriores
quanto ao mascaramento do sinal do ouvido humano para diminuir a taxa de bits Desta
forma o ruiacutedo de quantizaccedilatildeo eacute distribuiacutedo por banda de frequumlecircncias de um modo que este eacute
mascarado pelo sinal total tornando-se inaudiacutevel (FRAUNHOFER IIS 2006)
As principais diferenccedilas entre o AAC e os padrotildees anteriores satildeo
(FRAUNHOFER IIS 2006)
a) Banco de filtros o AAC natildeo utiliza o banco de filtros hiacutebrido utilizado no MP3 e sim um
banco de filtros MDCT que supera o desempenho do anterior devido a um aumento do
tamanho das janelas de filtragem de 576 para 1024 linhas espectrais por transformada
b) Ajuste Temporal de Ruiacutedo (ou TNS Temporal Noise Shaping) ajusta a distribuiccedilatildeo do
ruiacutedo de quantizaccedilatildeo no tempo para uma prediccedilatildeo no domiacutenio da frequumlecircncia
c) Prediccedilatildeo teacutecnica utilizada em sistemas de codificaccedilatildeo de voz baseando-se no fato de que
certos tipos de sinais de aacuteudio satildeo previsiacuteveis
d) Quantizaccedilatildeo o AAC permite um controle muito fino da resoluccedilatildeo da quantizaccedilatildeo Desta
forma a taxa de bits pode ser utilizada com mais eficiecircncia
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
43
As aplicaccedilotildees do AAC incluem aacuteudio para internet TV e raacutedio digital e dispositivos de
reproduccedilatildeo portaacuteteis
42 DOLBY AC-3 SISTEMA AMERICANO
O sistema de codificaccedilatildeo AC-3 foi desenvolvido pela Dolby para aplicaccedilotildees de
aacuteudio multicanal Eacute capaz de transmitir 51 canais de aacuteudio atraveacutes de uma taxa de 384 kbps
conservando os niacuteveis de aacuteudio exigidos para os sistemas HDTV Isto resulta em um melhor
desempenho dos sons fortes como explosotildees motores e efeitos especiais (ROBIN 2000)
A frequecircncia de amostragem considerada pelo sistema AC-3 eacute de 48 kHz por
canal o que demanda uma taxa de aproximadamente 5 Mbps para a transmissatildeo dos 51
canais de aacuteudio Este fato constitui um problema devido agraves limitaccedilotildees do canal de transmissatildeo
designado para sistemas HDTV (6 MHz nos EUA e 8 MHz na Europa) pois no sistema
completo deve-se levar a informaccedilatildeo de viacutedeo cuja taxa eacute de 182 Mbps (formato MPEG-2
americano) junto com o sinal de aacuteudio (VASQUES et al 2000)
Para solucionar esse problema eacute necessaacuterio realizar a compressatildeo do sinal a
fim de se reduzir a taxa de bits a transmitir conservando os padrotildees de qualidade do sinal
original O sistema Dolby AC-3 oferece um sistema de compressatildeo baseado na sensibilidade
do ouvido humano o qual eacute diferente para as diversas componentes de frequumlecircncia que
formam o espectro de audiccedilatildeo como jaacute visto no capiacutetulo anterior Desta forma haveraacute a
possibilidade de designar os niacuteveis de quantizaccedilatildeo adequados de acordo com o niacutevel de
percepccedilatildeo de uma componente de frequumlecircncia num determinado instante de tempo Assim as
degradaccedilotildees que porventura o sinal vier a sofrer natildeo seratildeo percebidas pelo sistema de
audiccedilatildeo
A largura de faixa designada para cada canal eacute mostrada na Tabela 3 Cada
canal de entrada no codificador AC-3 pode ser amostrado a uma frequumlecircncia de 32 kHz 441
kHz ou 48 kHz As duas uacuteltimas satildeo utilizadas para aacuteudio com acompanhamento de viacutedeo e
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
44
portanto constituem um compromisso entre as frequumlecircncias de varredura de quadro e linha a
fim de assegurar um nuacutemero inteiro de amostras de aacuteudio por quadro ou campo (VASQUES
et al 2000)
Tabela 3 - Canais de aacuteudio suportados pelo codificador AC-3 (VASQUES 2000)
No caso de HDTV eacute utilizada a frequumlecircncia de amostragem de 48 kHz a qual eacute
gerada a partir de um oscilador padratildeo de 27 MHz mostrado na Ilustraccedilatildeo 20 com o objetivo
de sincronizar o codificador de aacuteudio e o codificador de viacutedeo
Com relaccedilatildeo ao canal LFE a filtragem passa-baixas eacute feita por um filtro com
frequumlecircncia de corte em 120 Hz O niacutevel DC eacute eliminado mediante um filtro passa-altas com
frequumlecircncia de corte de 3 Hz (-3 dB)
Possui um fator de escala de 45 bits por banda (144 dB) e o comprimento do
frame de aacuteudio para uma taxa de amostragem de 48 kHz eacute calculado igualmente ao MPEG
(ROBIN 2000)
ms3283204384 (22)
Um diagrama de blocos simplificado do codificador AC-3 eacute mostrado
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
45
na Ilustraccedilatildeo 21
Ilustraccedilatildeo 20 - Conversatildeo AD dos sinais de aacuteudio no sistema AC-3 (VASQUES 2000)
Primeiramente os pulsos PCM passam por um banco de filtros no qual o
sistema AC-3 identifica as caracteriacutesticas do sinal dentro do domiacutenio da frequumlecircncia A anaacutelise
do banco de filtros eacute implementada atraveacutes da MDCT
No codificador AC-3 a transformada de um sinal de aacuteudio para o domiacutenio da
frequumlecircncia eacute feita a partir da formaccedilatildeo de blocos de aacuteudio de 512 amostras com uma
superposiccedilatildeo de 256 amostras com blocos adjacentes Desta forma um bloco de aacuteudio eacute
formado a cada 533 ms (para 48 kHz) a partir de 256 amostras preacutevias e de 256 amostras
novas (VASQUES et al 2000)
Ilustraccedilatildeo 21 Diagrama de blocos do codificador Dolby AC-3 (ROBIN 2000)
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
46
Essa forma de segmentaccedilatildeo dobra a quantidade de informaccedilatildeo a ser
processada Sua vantagem estaacute no fato de que quando o sinal eacute decodificado o som
reproduzido fica livre do efeito de blocos (ruiacutedo) que geralmente aparece quando um sinal de
infinitas amostras eacute processado atraveacutes de blocos com um nuacutemero finito de amostras
Apoacutes a obtenccedilatildeo do sinal de aacuteudio no domiacutenio da frequumlecircncia ocorre a
codificaccedilatildeo dos coeficientes MDCT cada coeficiente eacute representado por nuacutemeros reais cujos
valores satildeo escalonados na faixa de -1 a 1 O formato empregado no sistema AC-3 para a
representaccedilatildeo eacute a notaccedilatildeo em ponto flutuante Os 13 bits consecutivos depois do ponto
decimal representam o valor da mantissa normalizada que seraacute posteriormente quantizada e
codificada juntamente com o expoente (VASQUES et al 2000)
Com relaccedilatildeo ao frame de sincronizaccedilatildeo AC-3 este eacute formado a partir do
agrupamento de seis blocos codificados de aacuteudio com campos adicionais de sincronizaccedilatildeo
sinalizaccedilatildeo e detecccedilatildeo de erros Cada frame representa portanto 15366256 amostras de
aacuteudio codificadas e constitui a unidade de codificaccedilatildeo (ROBIN 2000)
No segundo bloco da Ilustraccedilatildeo 21 processo de codificaccedilatildeo dos expoentes
cada bloco de aacuteudio contido num frame eacute formado por um conjunto de expoentes e seu
correspondente conjunto de mantissas Desta forma um frame de sincronizaccedilatildeo eacute formado
por seis conjuntos de expoentes e seis conjuntos de mantissas Para a codificaccedilatildeo de cada
conjunto de expoentes o sistema AC-3 utiliza trecircs modos de codificaccedilatildeo D15 D25 e D45 O
modo D15 codifica a diferenccedila entre os expoentes individuais de frequumlecircncias adjacentes O
D25 codifica a diferenccedila entre cada par de expoentes consecutivos E por fim o modo D45
codifica a diferenccedila entre grupos consecutivos de quatro coeficientes (VASQUES et al 2000)
No terceiro bloco da Ilustraccedilatildeo 21 tem-se a alocaccedilatildeo de bits que consiste em
um algoritmo com a finalidade de determinar o nuacutemero de niacuteveis de quantizaccedilatildeo necessaacuterio
para a codificaccedilatildeo de cada mantissa visto no quarto bloco A execuccedilatildeo eacute feita a partir do
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
47
modelo psico-acuacutestico do ouvido a fim de evitar que a distorccedilatildeo introduzida no sinal seja
percebida pelo sistema auditivo humano
Na parte final do diagrama de blocos da Ilustraccedilatildeo 21 o codificador calcula o
tipo de quantizador designado para cada coeficiente Este resultado deslocado de 5 bits para a
direita eacute chamado de ponteiro de alocaccedilatildeo de bits (VASQUES et al 2000)
Por fim no bloco de quantizaccedilatildeo das mantissas apoacutes serem calculados os
ponteiros para cada componente de frequumlecircncia eacute feita a quantizaccedilatildeo do valor da mantissa
correspondente O nuacutemero de niacuteveis de quantizaccedilatildeo pode variar de 0 a 65536 o que
corresponde a uma precisatildeo de 0 a 16 bits na representaccedilatildeo do valor de cada mantissa
O sistema Dolby AC-3 eacute apropriado em aplicaccedilotildees HDTV multimiacutedia
internet entre outros Mas a principal vantagem de sua utilizaccedilatildeo se deve ao fato da
normalizaccedilatildeo do sistema de volume que eacute discutido a seguir
421 Normalizaccedilatildeo do Sistema de Volume
O problema da variaccedilatildeo do niacutevel (volume) de aacuteudio nos sistemas de televisatildeo
convencionais durante a mudanccedila de canal ou assistindo a diferentes programas num mesmo
canal eacute um fator que constantemente enfrenta-se nos dias atuais Isto se deve ao fato de que
alguns canais transmitem o aacuteudio em niacuteveis mais baixos ou mais altos que outros de forma
que o telespectador deve variar repetidamente o volume de seu receptor a fim de escutar os
canais em um niacutevel uniforme ajustado de acordo com sua proacutepria escolha (VASQUES et al
2000)
O sistema AC-3 proporciona uma soluccedilatildeo para esse problema introduzindo o
sub-campo dialnorm de 5 bits dentro de um campo o qual indica o nuacutemero de dBacutes com que
foi codificado o niacutevel de diaacutelogo em relaccedilatildeo ao niacutevel maacuteximo de codificaccedilatildeo (0 dB = 100)
(VASQUES et al 2000) Portanto o valor do dialnorm eacute utilizado pelo sistema de controle de
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
48
volume do receptor a fim de determinar o niacutevel de reproduccedilatildeo do aacuteudio de acordo com o niacutevel
de volume ajustado pelo telespectador
Aleacutem da normalizaccedilatildeo o sistema AC-3 classifica a reproduccedilatildeo de formas
distintas de sons na forma de serviccedilos Tem por objetivo oferecer ao telespectador maiores
facilidades e vantagens na reproduccedilatildeo do aacuteudio que estaacute sendo decodificado Os serviccedilos satildeo
classificados em principais e associados
Os serviccedilos especiais podem conter tanto os tipos de sons que aparecem em um
programa de TV transmitido por sistemas de TV convencionais como muacutesicas e efeitos
especiais que produz todos os tipos de som de programas Ambos os serviccedilos podem utilizar
os 6 canais de aacuteudio e serem transmitidos a uma taxa de 320 ateacute 384 kbps
Jaacute os serviccedilos associados satildeo serviccedilos adicionais que oferecem algumas
facilidades para pessoas com problemas de visatildeo ou audiccedilatildeo
Cada serviccedilo de aacuteudio eacute codificado atraveacutes de uma sequumlecircncia de frames que
posteriormente satildeo multiplexados junto com o sinal de viacutedeo para serem transmitidos dentro
de um determinado programa de TV (VASQUES et al 2000)
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
49
5 COMPARACcedilOtildeES ENTRE AS CODIFICACcedilOtildeES DE AacuteUDIO NOS PADROtildeES
DE TV DIGITAL
O padratildeo europeu (ou DVB - Digital Video Broadcasting) surgiu em 1993
atraveacutes de um memorando de entendimento entre diversos grupos puacuteblicos e privados e teve
como foco a transmissatildeo em muacuteltipla programaccedilatildeo (multicasting) para aparelhos de televisatildeo
digital com definiccedilatildeo padratildeo (standart) O FCC (Federal Communication Commission)
adotou o ATSC (ou Advanced Television System Committee) nos Estados Unidos em 1996 e
teve como foco a difusatildeo da televisatildeo de alta definiccedilatildeo O padratildeo japonecircs (ou ISDB
Integrated Service Digital Broadcasting)- foi criado em 1999 e foi desenhado com foco na
transmissatildeo para aparelhos portaacuteteis e moacuteveis aleacutem da alta definiccedilatildeo As transmissotildees
terrestres de TV digital tiveram iniacutecio no final de 1995 na Europa no final de 1998 nos
Estados Unidos e em dezembro de 2003 no Japatildeo (BATISTA 2005)
Para a codificaccedilatildeo do sinal fonte de viacutedeo e multiplexaccedilatildeo haacute um consenso na
utilizaccedilatildeo do padratildeo MPEG-2 Embora a grande dificuldade de compressatildeo e transmissatildeo de
sinais na televisatildeo digital seja devido agraves informaccedilotildees de viacutedeo o aacuteudio representa uma parcela
importante de informaccedilotildees para o usuaacuterio final (BATISTA 2005)
Os trecircs padrotildees apresentam capacidade de lidar com o aacuteudio na mesma
configuraccedilatildeo embora utilizem diferentes codificaccedilotildees do sinal fonte O padratildeo ATSC
emprega a codificaccedilatildeo Dolby AC-3 visto na Ilustraccedilatildeo 22 que eacute um sistema proprietaacuterio
implementado pelos laboratoacuterios Dolby dos Estados Unidos Ele eacute um algoritmo otimizado
para a radiodifusatildeo mas por outro lado natildeo suporta operaccedilotildees de decodificaccedilatildeo
recodificaccedilatildeo do sinal necessaacuterias em estuacutedios de TV (ABERTSET 2004)
A Ilustraccedilatildeo 22 mostra as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que esta uacuteltima consiste na modulaccedilatildeo 8-VSB (Vestigial Side Band)
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
50
Ilustraccedilatildeo 22 Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ATSC
(INATEL 2001)
O ISDB optou por adotar uma variante do MPEG-2 conhecido como MPEG-2
AAC (Advanced Audio Coding) visto na Ilustraccedilatildeo 23 Esse padratildeo incorpora
desenvolvimentos mais recentes na aacuterea de algoritmos sacrificando a compatibilidade
regressiva com o MPEG-1 O MPEG-2 AAC consegue obter som com qualidade de CD
operando a taxas de 96 kbps Tal compactaccedilatildeo eacute obtida com o uso de algoritmos e teacutecnicas
mais aprimoradas Uma diferenccedila significativa em relaccedilatildeo ao MPEG-2 BC eacute que no AAC eacute
feita uma anaacutelise da redundacircncia de informaccedilotildees entre os vaacuterios fluxos o que natildeo ocorre no
BC O MPEG-BC ou MPEG-2 Aacuteudio visto na Ilustraccedilatildeo 24 eacute compatiacutevel com o MPEG-1 e
eacute a codificaccedilatildeo utilizada pelo padratildeo DVB (ABERTSET 2004)
Ilustraccedilatildeo 23 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo ISDB
(INATEL 2001)
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
51
Ilustraccedilatildeo 24 - Camadas de codificaccedilatildeo multiplexaccedilatildeo e transmissatildeo do Padratildeo DVB
(INATEL 2001)
As Ilustraccedilotildees 23 e 24 mostram as camadas de codificaccedilatildeo multiplexaccedilatildeo e
transmissatildeo sendo que os padrotildees ISDB e DVB contemplam a modulaccedilatildeo COFDM (Coded
Orthogonal Frequency Division Multiplexing) diferentemente do padratildeo ATSC
O AC-3 tem o inconveniente de ser um padratildeo proprietaacuterio Por outro lado o
MPEG por ser um padratildeo altamente flexiacutevel mostra um desempenho de codificadores
dependente da implementaccedilatildeo criando a possibilidade de codificadores de diferentes
fabricantes apresentarem comportamento consideravelmente desigual
Segundo o Relatoacuterio do Grupo Teacutecnico ABERTSET o AC-3 apresenta uma
qualidade de aacuteudio superior a do MPEG-2 BC e jaacute tem uma grande base instalada Jaacute o AAC
tem uma base ainda em crescimento mas eacute a mais recente codificaccedilatildeo com 51 canais e a
que tem o melhor desempenho e eficiecircncia de codificaccedilatildeo (ABERTSET 2004)
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
52
6 CONCLUSOtildeES
Os paracircmetros teacutecnicos de aacuteudio dos principais padrotildees de TV digital existentes
no mundo ATSC DVB e ISDB satildeo de extrema importacircncia para a escolha de qual destes
padrotildees poderaacute ser adotado no Brasil como tambeacutem para os estudos de um possiacutevel
desenvolvimento do Sistema Brasileiro de Televisatildeo Digital (SBTVD)
Combinando uma melhor qualidade de aacuteudio e viacutedeo com a possibilidade de
interaccedilatildeo com o usuaacuterio pretende-se ter no Brasil alta definiccedilatildeo com multi-programaccedilatildeo
recepccedilatildeo moacutevel e portaacutetil capacidade de inclusatildeo digital e transmissatildeo de informaccedilotildees e
serviccedilos usando o canal de TV digital (datacasting)
Pesquisas de alta qualidade sobre processamento digital de sinais satildeo realizadas
em praticamente todo o territoacuterio nacional outras relacionadas especificamente com sinais de
aacuteudio e viacutedeo digitalizados tambeacutem satildeo praticadas e por isso eacute essencial que haja recursos
disponiacuteveis para tanto
Como pocircde ser observada neste trabalho a teoria de aacuteudio digital eacute
imprescindiacutevel para a completa compreensatildeo de um padratildeo de aacuteudio Da conversatildeo AD
partindo do Teorema de Nysquist e conceitos de amostragem passa-se ao entendimento dos
processos de quantizaccedilatildeo e codificaccedilatildeo Jaacute a abordagem sobre interfaces digitais mostra
algumas das vantagens da utilizaccedilatildeo do aacuteudio digital nos sistemas de TV presentes no mundo
como sonorizaccedilatildeo espacial e multicanais
Aleacutem destas vantagens os sistemas de compressatildeo MPEG e Dolby permitem um
estudo aprofundado para a futura definiccedilatildeo do padratildeo de aacuteudio digital a ser utilizado no
Brasil O padratildeo ATSC utiliza a codificaccedilatildeo Dolby AC-3 enquanto os padrotildees ISDB e DVB
empregam o MPEG-2 AAC e MPEG-2 BC respectivamente
O padratildeo brasileiro pode vir a se diferenciar dos padrotildees existentes
essencialmente em dois aspectos O primeiro aspecto se refere agrave tecnologia de compressatildeo
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
53
dos sinais de aacuteudio e viacutedeo O padratildeo brasileiro poderaacute vir a optar pela tecnologia de
compressatildeo conhecida como MPEG-4 ou H264 ao inveacutes do MPEG-2 adotado em todos os
padrotildees de TV digital existentes hoje Na compressatildeo de aacuteudio adotaria-se o MPEG-4 AAC
em substituiccedilatildeo ao Dolby AC-3 ao MPEG-2 BC ou ao MPEG-2 AAC
O MPEG-4 tem uma taxa de compressatildeo superior estaacute sendo utilizada nas
transmissotildees para equipamentos moacuteveis no Japatildeo e eacute vista como sucessora do MPEG-2
Enquanto os padrotildees anteriores satildeo focados apenas em compressatildeo o MPEG-4 fornece
funcionalidades como escalabilidades de taxas de bits representaccedilatildeo baseada em objetos e eacute
baseado em um conjunto de ferramentas com taxas de bits a partir de 2 kbps por canal Aleacutem
disso o codificador MPEG-4 inclui ferramentas de codificaccedilatildeo de vaacuterios paradigmas de
codificaccedilatildeo diferentes como codificaccedilatildeo de aacuteudio parameacutetrico codificaccedilatildeo da fala e
codificaccedilatildeo de sub-banda Alguns grupos de pesquisa no Brasil estatildeo estudando o assunto
atualmente Eacute preciso antecipar a difusatildeo dessa tecnologia no mundo e o custo de sua adoccedilatildeo
no Brasil Para uma avaliaccedilatildeo de custos eacute necessaacuterio iniciar negociaccedilotildees com os detentores de
patentes dessas tecnologias
Desta forma o MPEG-4 seria a continuaccedilatildeo da linha de estudo desenvolvida
neste trabalho em que apesar de sua limitaccedilatildeo - cuja pesquisa foi apenas teoacuterica - pode-se
desenvolver protoacutetipos e modelos de simulaccedilatildeo os quais apresentem valores praacuteticos para
comparaccedilatildeo entre os padrotildees de aacuteudio apresentados
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
54
REFEREcircNCIAS
ABERTSET TV didital brasileiraTextos importantes Associaccedilatildeo brasileira de emissoras deRaacutedio e Televisatildeo (ABERT) e Sociedade Brasieleira de Engenharia de Televisatildeo eTelecomunicaccedilotildees (SET) Grupo Teacutecnico ABERTSET Julho2004 Disponiacutevel emlthttp wwwsetcombrgt Acesso em 18mar2006
BATISTA JC Efeitos ecenocircmicos tecnoloacutegicos e sociais da TV digital no Brasilalternativas pata transmissotildea terrestre Universidade Federal do Rio de Janeiro Instituto deEconomia Seacuterie Textos para discussatildeo Junho2005
BENSON B K Audio engineering handbook 2ed New York McGraw-Hill 2002
COSTA LRM Sistema de Geraccedilatildeo Transmissatildeo Recepccedilatildeo e Armazenamento deInformaccedilotildees Meacutedicas via Web Universidade de Brasiacutelia Depto Engenharia Eleacutetrica Brasiacutelia2005
CREATIVE Produts [2005] Disponiacutevel emlt httpwwwcreativecomproductswelcomeaspcategory=1gt Acesso em 21nov2005
NASCIMENTOJQ Pronunciamento do secretaacuterio executivo do Ministeacuterio dasComunicaccedilotildees no Congresso da Sociedade Brasileira de Engenharia de Televisatildeo eTelecomunicaccedilotildees[sl2002] Disponiacutevel emlthttp wwwradiobrasgovbrintegras02integra_3107_9htmgt Acesso em 21nov2005
HAYKIN S VAN VEENB Sinais e sistemas Porto Alegre Bookman 2000
FRAUNHOFER IIS Aacuteudio e Multimiacutedia MPEG 2 AAC 2006 Disponiacutevel emlthttpwwwiisfraunhoferdegt Acesso em 18032006
IANO Y SILVA E VAacuteSQUES G CHIQUITO J Uma visatildeo geral do sistema decompressatildeo de aacuteudio para HDTV (MPEG) Sistema Europeu Revista Cientiacutefica PerioacutedicaInatel Minas Gerais vol3 n1 p55-64 Abril2000
IAZZETTA F Aacuteudio Digital Disponiacutevel emlthttpwwwecauspbrprofiazzettatutoraudioa_digitala_digitalhtmlgtAcesso em18032006
INATEL Programa Cisco Networking Academy Disponiacutevel emlthttpwwwinatelbrciscoindexaspgt Acesso em 18032006
KLAUTAU JR ABR Poacutes graduaccedilatildeo em Suporte Teacutecnico a Sistemas de Computaccedilatildeo PCD Universidade Federal do Paraacute Beleacutem 2004 Disponiacutevel emlthttpwwwufpabrportalufpainterna_posgraduacaophpgt Acesso em 18032006
LATHI BP Modern digital and analog communication systems 3ed New York OxfordUniversity Press 1998
LUTHER AC Principles of digital audio and video 2ed Boston Artech House Inc 1997
MPEG MPEG org MPEG Pointers and Resources 2005 Disponiacutevel emlthttpwwwmpegorggtAcesso em 21nov2005
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000
55
PINHO AJ Codificaccedilatildeo e Compressatildeo de Dados 2005 Disponiacutevel em lthttpwwwieetapt~apccdaula02pdfgt Acesso em 18032006
POHLMANN KC Principles of digital audio 5ed New York McGraw-Hill 2005
REIMERS U Digital video broadcasting the international standard for digital televisionNew York Springer2001
ROBIN M POULINM Digital television fundamentals design and installation of videoand audio systems 2ed New York McGraw-Hill 2000
SPRATLING Nigel The Book II More engineering guidance for the digital transition 2edNevada NVision Inc1999
VASQUES G IANO Y SILVA E Compressatildeo de sinais de aacuteudio para HDTV SistemaDolby AC-3 (USA) Revista Cientiacutefica Perioacutedica Inatel Minas Gerais vol3 n1 p65-73Abril2000