1
UFPE
Armazenamento de Sinais de Áudio
Geber Ramalho ([email protected])Jeferson Valadares ([email protected])Ulisses Montenegro ([email protected])
2
UFPE
Gravação/Armazenamento
Definição• Meio pelo qual o som pode ser capturado
permanentemente e, eventualmente, re-trabalhado• é baseada na conversão de sinais elétricos em
– sinais magnéticos– padrões mecânicos– padrões óticos– sinais eletrônicos (chips)
Plano de aula• Fita magnética e toca discos• Gravadores analógicos• Gravadores digitais e CD• Arquivos de som para computador
3
UFPE
Fitas magnéticas: contituição Base de poliéster
• função mecânica• espessura 25 a 40m
Material magnético• Óxido de ferro Fe2O3
• Dióxido de cromo: CrO2
• Ferro puro (metal): Fe
Material adesivo• resina
Solvente
N SN S
N SN S
N SN S
4
UFPE
Fabricação de fitas: etapas
1) Moagem• Mistura adesivo, óxido (partículas magnéticas ) e
solvente para forma uma pasta fluida• aplica a pasta sobre a base
2) Orientação• as partículas são orientadas
IMÂ
5
UFPE
Fabricação de fitas: etapas
3) Secagem• Evaporação do solvente• Túnel de secagem
4) Enrolamento
5) Polimento
6) Corte• no cassete
– comprimento 45, 60, 90 e 120 minutos– largura 3,8 mm
7) Embalagem
6
UFPE
Princípio de funcionamento Ciclo de histerese
• uma partícula (ponto 0) exposta a uma força magnética H é magnetizada até a saturação (ponto 1)
• Quando a força é “desligada”, um certo fluxo magnético permanece (ponto 2)
• Submetida a uma força magnética negativa, o nível zero de magnetização é obtido (ponto 3)
• o ciclo continua...
7
UFPE
Característica de transferência A função de transferência não é linear
• as variações no sinal elétrico não são reproduzidas fielmente pela magnetização
• implica em distorção
entrada
saída
8
UFPE
Polarização (bias) Solução: polarização
• idéia: forçar o sinal a “trabalhar” na zona linear somando-se outro sinal a ele
• onda de alta freqüência (AM) que pode ser filtrada depois
9
UFPE
Gravadores 3 componentes
• cabeças• eletrônica• mecânica
10
UFPE
Cabeça de gravação Idéia:
• a variação de corrente na bobina induz fluxo magnético correspondente no núcleo
• pelo fato de existir um gap no núcleo, o fluxo magnético é forçado a atravessar a fita orientando as suas partículas
• Ao cessar o campo, pela propriedade da remanência, o campo magnético permanece
11
UFPE
Cabeça de apagamento Idéia:
• mesmo princípio da cabeça de gravação, porém• introduz um sinal de alta freqüência de forma a
“bagunçar” o alinhamento dos domínios (partículas)
O gap • deve ser grande: aprox. 20 m• para poder mudar, por exemplo, pelo menos 10 vezes
cada domínio (partícula) no curto período de tempo em que a fita passa pela cabeça
12
UFPE
Cabeça de reprodução Princípio inverso da gravação
• a passagem da fita magnetizada, implica em uma variação de fluxo magnético no núcleo, induzindo uma corrente correspondente
• deve ter alta permeabilidade (sensível às variações de fluxo da fita)
Gap• basicamente da mesma ordem do da cabeça de
gravação• largura do gap < comprimento de onda• se for maior, não conseguirá captar nas extremidades do
núcleo a variação de fluxo magnético
13
UFPE
Cabeças Fazer ajustes
• Zenite• Azimute
E de vez em quando desmagnetizar...• Magnetismo => ruído• Usar desmagnetizador (ponta de prova gerando 60
Hz)
14
UFPE
Cabeças
3 cabeças é melhor do que 2• cada uma pode ser projetada otimamente
15
UFPE
Velocidade Quanto maior a velocidade melhor a qualidade!
Velocidade• cassete: 4,75 cm/s (1 7/8 ips)• rolo: 9,5 cm/s (3 3/4 ips) • rolo: 19 cm/s (7 1/2 ips)• rolo: 38 cm/s (15 ips)
Exemplo• gravar freqüência de 10kHz• como = v/f• cassete: = 4,75/10000 = 0,5 m• rolo: = 19/10000 = 3,8 m
16
UFPE
cabeça fita
cabeça fita12
Pistas (tracks)
Completa monofônica
Meia pista monofônica
Meia pista estéreo (Revox)
Quatro pistas mono
cabeça fitaesqdir
cabeça fita1234
17
UFPE
Pistas Quatro pistas estéreo
• cassete
N pistas mono (estúdio)• 8• 16• 24• 32
crosstalk• informação de uma pista
vaza para a outra
cabeça fitaesqdirdiresq
cabeça fita12345678
1
18
UFPE
Limitações Analogia entre fita e amostragem
• largura do gap taxa de amostragem• Largura física da fita quantificação
Faixa dinâmica reduzida• Saturação: não pode-se usar níveis muito elevados de
sinal, senão distorce• Ruído branco: o ruído de fundo (hiss) impede que se
use níveis de sinal muito baixos sem serem mascarados
• Solução– Tipo de fita: Metal melhor– Velocidade de gravação: mais rápido melhor– Largura de fita: mais larga melhor
19
UFPE
Limitações das fitas Resposta em freqüência
• fraca nas baixas e altas freqüências • Polarização causa cancelamentos nas altas freqüências • Tamanho do Gap passa a ser crítico
Soluções• Pré-equalização para corrigir a resposta • Velocidade de gravação: mais rápido melhor• Tipo de fita: Metal
20
UFPE
Limitações das fitas Ruído
• Existe muito ruído de fundo (hiss)• a situação é crítica nas altas freqüências onde a
energia da música é mais fraca• a relação sinal ruído deveria ser de pelo menos 60dB
21
UFPE
Redutores de ruído Solução
• utilizar redutores de ruído
idéia• dar ênfase em certas freqüências na gravação e e
atenuá-las na reprodução
Sistemas• Dolby• dbx
22
UFPE
ilustraçãoam
p
freq
ruído
freq
música
freq
=
amp
freq
ruído
freq
música
freq
=
NORMALNORMAL
ÊnfaseÊnfase
freq
Gra
vaçã
oG
rava
ção
Gra
vaçã
oG
rava
ção
repr
oduç
ãore
prod
ução
freqatenuaçãoatenuação
23
UFPE
Redutores de ruído Sistema dbx
• enfatiza altas freqüências (taxa de 2:1) e depois atenua com a mesma curva
• trabalha então em uma única banda• reduz ruído em 30dB e aumenta headroom (faixa
dinâmica) em 10dB
Dolby A• divide o espectro em 4 bandas de freqüências que são
comprimidas e expandidas independentemente• Além disto, Dolby só opera em passagens de baixa
energia (abaixo de -10 VU) • consegue redução de 10dB abaixo de 5kHz e 15dB
acima de 15kHz
24
UFPE
Redutores de ruído Dolby B
• sistema mais barato para cassetes• só opera nas altas freqüências reduzindo hiss em
10dB
Dolby C • trabalha em um espectro mais largo e reduz 20dB
Dolby SR• melhor dos sistemas Dolby• atua em regiões onde o sinal tem nível baixo a médio• redução de mais de 25dB em grande parte do
espectro audível– ex. em 15 ips (38 m/s) é possível obter uma relação
sinal ruído de 105dB
25
UFPE
Toca-disco vinil: só curiosidades... Disco
• material: vinil• velocidade: 78, 45 ou 33 rpm
Reprodução: agulha + capsula
Sulcos e codificação
agulha
disco
sinal esquerdo induzido
sinal direito induzido
mono direito esquerdo d+e (em fase) d+e (em contrafase)
26
UFPE
Toca-disco vinil Controle motor da rotação
• Correia• Polia• Tração direta
Rastreio• para evitar erro: braço inclinado
– J, S, reto com capsula em anglo, etc.• para compensar pressão: anti-skating
Reposta em freqüência• Para corrigir a fraca reprodução nas altas e nas
baixas: equalização RIAA
27
UFPE
analógico digital
Sinal reconstituído
Sinal lido
Sinal magnético
Gravação Digital em Fita Idéia
• grava-se a informação digital (binária, PCM), em vez do próprio sinal
• não é necessário polarizar
Reprodução detecta mudanças de orientação
28
UFPE
Largura de banda Definição
• resolução (distância física mínima entre os picos) do sinal
• Influencia no espectro em que se pode gravar e pode provocar erros
Interferência• deturpações nas mudanças dos picos
Sinal escrito
Sinal lido
Sinal reconstruído
29
UFPE
Largura de banda Caso digital
• 50 vezes maior do que a de um gravador analógico– 44,1 KHz x 16 bits = 705 Kbps– somando-se dados para sincronização e correção de erros,
seria preciso 1Mbps para a máxima freqüência– o problema piora para gravadores multipista
O grande desafio• maximizar densidade sem provocar erros!!!
Métodos• usar gravação vertical em vez de longitudinal
– não se está limitado ao tamanho das partículas magnéticas– difícil de ser operacionalizado
30
UFPE
2 Tipos de Cabeças Estacionárias
• DASH (digital audio stationary head)
Rotativas• duas cabeças giram deixando, por causa do
movimento da fita, um rastro diagonal• truque que aumenta o “tamanho útil”da fita
Exe
mp l
o do
ví d
eo c
asse
te
31
UFPE
Balanço Vantagens da cabeça rotativa
• maior largura de banda • maior densidade de gravação (gasta menos fita)• mais fácil de sincronizar com sinais de vídeo• etc.
Vantagens da cabeça rotativa• em algumas aplicações particulares, difícil de fazer
edições muito precisas – melhor usar memória - chips
• mais difícil fazer overdubbing ou puch-in e punch-out devido a multiplexação
• menos simples de projetar e mais caras
32
UFPE
Armazenamento Digital de Áudio
Digital Audio Tape (DAT)Compact Disc (CD)
Arquivo wave (.wav)Arquivo de áudio da Sun (.au)
Codificação Sonora Perceptual (MPEG e MP3)Outros formatos
33
UFPE
DAT Início das pesquisas em 1981
Em 1983, dois padrões foram propostos:• S-DAT• R-DAT
R-DAT foi definido como padrão em 1986, e desde então o formato é conhecido simplesmente como DAT
Fita DAT:• padronizada exclusivamente para o formato DAT• dimensões: 73x54x10.5 mm• capacidade de aproximadamente duas a seis horas de
áudio• só começa a se deteriorar a partir da 200ª reprodução
34
UFPE
DAT O formato suporta três freqüências de
amostragem:• 32, 44.1 e 48 kHz
Dois níveis de bits de quantização• 12 bits não-lineares ou 16 bits lineares
Extensões ao padrão DAT, criadas por fabricantes• 12 bits a 96KHz• 24 bits a 48KHz
Gravadores DAT apresentam entradas e saídas digitais
• cópias digitais de alta qualidade
35
UFPE
DATDAT (Gravação/Reprodução) Fita Pré-Gravada
Standard Option 1 Option 2 Option 3
No Canais 2 2 2 4 2 2
Freqüênciade Amostrag
48 KHz 32 KHz 32 KHz 32 KHz 44.1 KHz
Bits dequantização
16 (linear) 16 (linear) 12 (não-linear)
12 (não-linear)
16 (linear) 16 (linear)
Tempo degravação(minutos)
120 120 240 120 120 80
Velocidadeda fita(mm/s)
8.15 4.075 8.15 8.15 12.225
Velocidadeangular dascabeças(rpm)
2000 1000 2000 2000
36
UFPE
DAT
1 Margin 5 IBG 9 PCM 13 PLL (sub)
2 PLL (sub) 6 ATF 10 IBG 14 Sub-2
3 Sub-1 7 IBG 11 ATF 15 Postamble
4 Postamble
8 PLL(PCM)
12 IBG 16 Margin
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Formato da Trilha
37
UFPE
DAT
ID code (PCM block or
subcode block)
8 bits
Block address (and subcode
ID)
8 bits
Parity
8 bits
Sync
8 bits
Data (PCM data and parity or subcode data and
parity)
256 bits (32 symbols)
W1 W2 P
Paridade: P = W1 W2 ( = Mod 2)Block address: corresponds to PCM or subcode data block,
the MSB indicates an ID bit (PCM or subcode data)
38
UFPE
DATID-0 (ID format) ID-1 a ID-7 Descricao
ID-1 (enfase) 00: off01: Pre-enfatizado (50/15 Sec)10,11: reservado
ID-2 (frequencia deamostragem)
00: 48Khz01: 44.1KHz10: 32KHz11: reservado
ID-3 (numero de canais) 00: 2 canais01: 4 canais10,11: reservado
ID-4 (numero de bits dequantizacao)
00: 16 bits linear01: 12 bits não-linear10,11: reservado
ID-5 (pitch da faixa) 00: 13,6 m01: 20,4 m10,11: reservado
ID-6 (inibicao de copia) 00: permissao de copia digital01: reservado10: inibicao de copia digital11: SCMS flag
0 0 (para audio)
ID-7 Pacote consiste de 32 ID-7s
39
UFPE
DAT
40
UFPE
Compact Disc Armazenamento de bits baseado em princípios
óticos
Tecnologia levou cerca de 10 anos desde concepção ate introdução no mercado
• 1972– Phillips introduziu o conceito de armazenamento ótico
de áudio em discos de tamanho limitado– Sony desenvolveu técnicas de correção de erros para
discos óticos de grandes dimensões• 1980
– padrão de Compact Disc Digital Audio foi criado e aprovado pelo Digital Audio Disc Commitee, um grupo representando mais de 25 empresas
41
UFPE
Compact Disc Tamanho da palavra e freqüência de amostragem
fixas• 16 bits• 44.1 kHz• dois canais (estéreo)• total de 1,41 milhões de bits por segundo de áudio
Dados adicionais de controle• correção de erro• sincronização• modulação
Taxa total de transferência chega a 4.3218 Mbps
42
UFPE
Compact Disc CD-DA define tamanho máximo em 6.3109 bits
• capacidade para 74 minutos e 33 segundos de áudio
Capacidade foi definida por sugestão de Herbert von Karajan
• coincide com a duração de uma execução ininterrupta da 9a Sinfonia de Beethoven
Variações nos parâmetros físicos permitem durações superiores a 80 minutos de áudio
CD players de qualidade exibem resposta de freqüência de 5Hz a 20kHz com desvio de ±0.2dB
• taxa de signal-to-noise acima dos 100dB• distorção harmônica a 1kHZ abaixo de 0.002%
43
UFPE
Compact Disc
Sync(27 bits)
SubCode
Data(96 bits)
Parity(32 bits)
Data(96 bits)
Parity(32 bits)
8 bitsP,Q,R,S,T,U,V,W
0.163mm1 frame (1/7.35 ms)
1,6 mm0,6 m
44
UFPE
Arquivos Wave
Tamanho Descrição4 bytes “RIFF”4 bytes Tamanho do arquivo (subtraído de 4)4 bytes “WAVE”4 bytes “fmt “4 bytes Tamanho da descrição do arquivo2 bytes Flag para mono (0x01) ou estéreo (0x02)4 bytes Taxa de amostragem4 bytes Bytes/sample2 bytes Alinhamento do bloco2 bytes Bits/sample4 bytes “data”4 bytes Tamanho do segmento de dados(n bytes) Dados
Little-Endian Word
Esquerdo (MSB) | Direito (LSB)
45
UFPE
Arquivos Wave Taxa de amostragem é dada em Hz
• e.g., 44.100Hz
Bytes/sample é calculado como(taxa de amostragem alinhamento de bloco)
Alinhamento de bloco é calculado como (canais bits por sample)/8
Bits por sample podem assumir apenas os valores 8 ou 16
Para arquivos em estéreo, o bloco de dados do canal esquerdo é imediatamente seguido do bloco do canal direito, em seqüência até o final do arquivo
46
UFPE
Arquivo de áudio da Sun (.au) Definido pela Sun em 1992
Várias codificações (ISDN u-law, PCM linear, ponto flutuante IEEE), de 8 a 64 bits
Várias taxas de amostragem (8000, 11025, 16000, 22050, 32000, 44100 e 48000 amostras/s)
Funções para manipulação incluídas nos sistemas operacionais da Sun e em Java
47
UFPE
Formato .au
Offset Tamanho Descrição 0 4 bytes ".snd" 4 4 bytes <Header size (h)> 8 4 bytes <Sample data size (s)> 12 4 bytes <Audio file encoding> 16 4 bytes <Sample rate> 20 4 bytes <Number of channels> 24 (h-24)bytes <Comment>(h) (s)bytes <Sample data>
Big-Endian Word
Esquerdo (LSB) | Direito (MSB)
48
UFPE
Codificação Sonora Perceptual Antes da compressão de áudio, um minuto de música
estéreo (qualidade de CD) ocupava 10 MB!• 44.100 amostras/s * 2 canais * 2 bytes/amostra * 60
s/min
Caso um arquivo destes fosse transmitido pela internet através de um modem padrão (28.8 Kbps) a transferência de 1 minuto levaria 49 minutos!
• 10.000.000 bytes * 8 bits/byte / (28.800 bits/s * 60 s/min)
Codificação sonora explora as propriedades do ouvido humano para conseguir uma redução de tamanho com pouca ou nenhuma perda perceptível na qualidade
49
UFPE
Codificação Sonora Perceptual - MPEG Eficiência atingida através de algoritmos que
exploram redundância em sinais e as não-relevâncias (mascaramento) no domínio de freqüência baseado em um modelo do sistema auditivo humano
• sinais redundantes e irrelevantes são perdidos na codificação
Ideal para ambientes que precisam de alta qualidade com um baixo bitrate: trilhas sonoras de jogos em CD-ROM, áudio para internet, sistemas de transmissão de áudio digital, etc.
50
UFPE
MPEG Audio Layer-3 (MP3) Início do desenvolvimento em 1987 pelo IIS
Sinais digitais sem compressão:• 16bits, 44.1KHz - 1.400 Mbit para 1s de música
estéreo
Através de codificação MPEG:• redução do tamanho por um fator de 4-24 através de
técnicas de codificação sonora perceptual– Layer 3: reduções de 10-12 vezes sem perda de
qualidade
Padronizado pela ISO e recomendado pela ITU-R para aplicações de broadcast que necessitem de um bitrate de 60 kbps/s por canal
51
UFPE
MP3 Performance
QualidadeSonora
Bandwidth Modo bitrate Taxa deredução
Som deTelefone
2.5 KHz mono 8 kbps 96:1
Melhorque ondas
curtas4.5 KHz
mono16 kbps 48:1
Melhorque rádio
AM7.5 KHz
mono32 kbps 24:1
Similar arádio FM
11 KHz estéreo 56-64 kbps 26-24:1
Quase CD 15 KHz estéreo 96 kbps 16:1
CD > 15 KHz estéreo 112-128kbps
14-12:1
52
UFPE
Outros Formatos AIFF (Apple/SGI)
• criado pela Apple para armazenamento de alta qualidade de instrumentos e som
• extensão AIFC ou AIFF-C suporta compressão
RealAudio (Real Networks)• voltado para streaming• compressão lossy, otimizada para baixa utilização de banda
IFF/8SVX (Amiga)• versão para áudio do padrão IFF do Amiga
VOC (Creative Labs)• padrão criado pela Creative Labs para sua placa Sound
Blaster, com limites de taxa de amostragem e de 8 bits de quantização
53
UFPE
Mídias para áudio digitalMídia Acesso Notas
Cabeça estacionária (fitamagnética)
Serial Gravação multitrackprofissional, váriosformatos coexistem
Fita de vídeo com cabeçarotatória (fita magnética)
Serial Vários formatos (VHS,8mm, Beta) e codificações
(NTSC, PAL, SECAM)Fita de áudio com cabeçarotatória (fita magnética)
Serial Formato profissionalNagra-D para gravações
em 4 canaisFita de Áudio Digital (DAT)
(fita magnética)Serial Compatibilidade mundial
Discos Rígidos(magnéticos e óticos)
Aleatório Discos removíveis sãomais lentos, porém mais
convenientesDisquetes (magnéticos) Aleatório Baratos, convenientes,
lentos, limitados e nãoconfiáveis
CDs (óticos) Aleatório Duráveis, vários níveis dequalidade, lentos para umamídia deste tipo de acesso
Memória (eletrônica) Aleatório Acesso rápido, excelentepara edição mas cara para
armazenamento
54
UFPE
Referências Ken C. Pohlman, Principles of Digital Audio, McGraw Hill,
1995, 3rd Edition
http://home.sprynet.com/~cbagwell/AudioFormats.html
http://www.iis.fhg.de/amm/techinf/layer3/index.html
http://www.mp3tech.org/
http://www.dv.co.yu/mpgscript/mpeghdr.htm
http://home.sprynet.com/~cbagwell/sox.html