255

Click here to load reader

RenatoFabbri ME Corrigida

Embed Size (px)

DESCRIPTION

SFSFDFDFDFDFDFDFDFDFDFDFDFDFFDFDFDFDFDFDFDFDFDFDFDFDEFEFDSF

Citation preview

  • Universidade de So PauloInstituto de Fsica de So Carlos

    Departamento de Fsica e InformticaGrupo de Fsica Computacional e Instrumentao Aplicada

    RENATO FABBRI

    Msica no udio digital: descrio psicofsica ecaixa de ferramentas

    So Carlos

    2013

  • RENATO FABBRI

    Msica no udio digital: descrio psicofsica ecaixa de ferramentas

    Dissertao apresentada ao Programa de Ps-graduao em Fsica do Instituto de Fsica deSo Carlos da Universidade de So Paulo, para aobteno do ttulo de Mestre em Cincias.

    rea de Concentrao: Fsica Aplicada

    Orientador: Prof. Dr. Osvaldo Novais de Oli-veira JuniorColaborador: Prof. Dr. Luciano da Fontoura Costa

    Verso Corrigida(verso original disponvel na Unidade que aloja o Programa)

    So Carlos

    2013

  • AUTORIZO A REPRODUO E DIVULGAO TOTAL OU PARCIAL DESTETRABALHO, POR QUALQUER MEIO CONVENCIONAL OU ELETRNICO PARAFINS DE ESTUDO E PESQUISA, DESDE QUE CITADA A FONTE.

    Ficha catalogrfica elaborada pelo Servio de Biblioteca e Informao do IFSC, com os dados fornecidos pelo(a) autor(a)

    Fabbri, Renato Msica no udio digital: descrio psicofsica ecaixa de ferramentas / Renato Fabbri; orientadorOsvaldo Novais de Oliveira Junior - verso corrigida-- So Carlos, 2013. 253 p.

    Dissertao (Mestrado - Programa de Ps-Graduao emFsica Aplicada) -- Instituto de Fsica de So Carlos,Universidade de So Paulo, 2013.

    1. Som. 2. udio digital. 3. Msica. 4.Psicofsica. 5. Arte e tecnologia. I. OliveiraJunior, Osvaldo Novais de, orient. II. Ttulo.

  • AGRADECIMENTOS

    Agradeo ao Prof. Luciano da Fontoura Costa e ao Prof. Osvaldo Novais de Oliveira Junior

    pela oportunidade e pela orientao deste trabalho.

    Agradeo ao corpo de funcionrios do IFSC, pela prestatividade e eficincia em todos os mo-

    mentos que precisei.

    Agradeo aos Prof. Rafael Santos Mendes e Prof. Adolfo Maia Junior pelas orientaes na

    gnese deste trabalho.

    Agradeo minha famlia, em especial minha esposa Thas Teixeira Fabbri e ao meu filho

    Antnio Anzoategui Fabbri.

    Agradeo ao meu irmo Ricardo Fabbri e ao amigo Vilson Vieira da Silva Junior pelas profcuas

    colaboraes acadmicas, artsticas e socialmente engajadas.

    Agradeo aos participantes do labMacambira.sf.net pelas colaboraes diretas e indiretas nos

    software, apresentaes e articulaes desde junho de 2011. Em especial agradeo ao Da-

    niel Penalva, Caleb Macarenhas, Chico Simes, Fbio Simes, Daniel Marostegan, Marcos

    Mendona, Geraldo Magela Rocha, Guilherme Lunhani, Patrcia Ferraz, Glerm Soares, Danilo

    Shiga, Edson "Presto" Corra, Vanessa Ferreira e Srgio Teixeira de Carvalho. Agradeo aos

    demais colaboradores das listas de email, IRC, AA e outros canais.

  • Agradeo ao Cultura Viva e aos pontos de cultura pelo apoio fundamental a este e outros traba-

    lhos. Agradeo em especial a estes Pontes e Cultura Digital e Ao Gri pelo suporte a este

    trabalho em aes regionais e nacionais: CDTL (PE), JuntaDados.org (BA), Ns Digitais (SP),

    Casa dos Meninos (SP), Nina Gri (SP), Ponto da Eco (RJ), Casa de Cultura Tain (SP) e

    Comisso Nacional dos Pontos de Cultura - CNPdC (GO).

    Agradeo s comunidades de cultura e software livre por todos os conhecimentos e tecnologias

    repassados e que compem esta contribuio.

  • Music is a hidden arithmetic exercise of the soul,which does not know that it is counting.

    Gottfried Leibniz (1646-1716)

    Music is a hidden metaphysical exercise of the soul,which does not know that it is philosophizing.

    Arthur Schopenhauer (1788-1860)

    from Pantheon import Obatalfrom World import sharing, kitten

    while True:if sharing == 0:

    Obatal.kill( kitten ) Autoria coletiva e anonima (2010)

  • RESUMOFABBRI, R. Msica no udio digital: descrio psicofsica e caixa de ferramentas. 2013.253p. Dissertao (Mestrado) - Instituto de Fsica de So Carlos, Universidade de So Paulo,So Carlos, 2013.

    A representao dos elementos bsicos da msica - tais como notas, ornamentos e estruturasintervalares - em termos do som discretizado bastante utilizada em software e rotinas paracriao musical e tratamento sonoro. No h, entretanto, uma abordagem concisa que relaci-one estes elementos s amostras sonoras. Nesta dissertao, cada elemento musical descritopor equaes que resultam diretamente nas sequncias temporais do som em sua representaodiscretizada. O elemento fundamental, a nota musical bsica com durao, volume, altura etimbre, relacionado quantitativamente s caractersticas do sinal digital. As variaes inter-nas, como tremolos, vibratos e flutuaes espectrais, tambm so contempladas, o que permitesintetizar notas com inspirao nos instrumentos musicais reais alm de sonoridades novas. Apartir desta representao das notas, dispomos de recursos para a gerao de estruturas musi-cais, como a mtrica rtmica, os intervalos de altura e os ciclos. As equaes deram origem auma caixa de ferramentas computacionais: scripts que realizam cada equao e geram exem-plos sonoros simples. Nomeamos massa, Msica e udio em Sequncias e Sries Amostrais,este ferramental e sua eficcia foi comprovada com a sntese de pequenas peas usando notasbsicas, notas incrementadas e notas em msica. possvel, tambm, sintetizar lbuns inteirosatravs de colagens dos scripts e parametrizao especificada pelo usurio. Com o paradigmade implementao em cdigo aberto, a (caixa de ferramentas) massa pode ser expandida emprocessos de co-autoria e usada livremente por msicos, engenheiros e outros interessados. Defato, o sistema j foi empregado por usurios externos para a produo de msicas, apresenta-es artsticas, experimentos psico-acsticos e a difuso da linguagem computacional atravsdo apelo ldico dos artefatos audiovisuais.

    Palavras-chave: Som. udio digital. Msica. Psicofsica. Arte e tecnologia.

  • ABSTRACTFABBRI, R. Music on digital audio: psychophysical description and toolbox. 2013. 253p.Dissertao (Mestrado) - Instituto de Fsica de So Carlos, Universidade de So Paulo, SoCarlos, 2013.

    The representation of the basic elements of music - such as notes, ornaments and intervalarstructures - in terms of discrete audio signal is often used in software for music creation and de-sign. Nevertheless, there is no unified approach that relates these elements to the sound discretesamples. In this dissertation, each musical element is described by equations that represent thesonic time samples, which are then implemented in scripts within a software toolbox, referredto as massa (Music and Audio in Sequences and Samples). The fundamental element, the mu-sical note with duration, volume, pitch and timbre, is related quantitatively to the characteristicsof the digital signal. Internal variations, such as tremolos, vibratos and spectral fluctuations,are also considered, which enables the synthesis of notes inspired by real instruments and newsonorities. With this representation of notes, resources are provided for the generation of mu-sical structures, such as rhythmic meter, pitch intervals and cycles. The efficacy of massa wasconfirmed by the synthesis of small musical pieces using basic notes, incremented notes andnotes in music. It is possible to synthesize whole albums through collage of the scripts and pa-rameterization specified by the user. With the paradigm of open source implementation, massatoolbox can be expanded in co-authorship processes and used freely by musicians, engineersand other interested parties. In fact, massa has already been employed by external users fordiverse purposes which include music production, artistic presentations, psychoacoustic expe-riments and computer language diffusion where the appeal of audiovisual artifacts is exploited.

    Keywords: Sound. Digital audio. Music. Psychophysics. Art and technology.

  • LISTA DE FIGURAS E TABELAS

    Figura 1.1 - Som digital em modulao por cdigo de pulsos (PCM): 25 amos-

    tras representadas por 4 bits cada uma. . . . . . . . . . . . . . . 35

    Figura 2.1 - Formas de onda musicais bsicas. As formas de onda sintticas

    esto em (a) e as formas de onda reais esto em (b). . . . . . . . 44

    Figura 2.2 - Espectros das ondas sonoras musicais artificiais bsicas. A se-

    noide tem o espectro puntual, a triangular apresenta somente os

    harmnicos mpares, caindo a 6dB por oitava; a onda quadrada

    tem somente os harmnicos mpares, caindo a 12dB por oitava;

    a onda dente de serra apresenta todos os harmnicos, caindo a

    6dB por oitava. . . . . . . . . . . . . . . . . . . . . . . . . . . 45

    Figura 2.3 - Espectros das ondas sonoras de uma nota de obo natural e de

    perodo amostrado. O som natural possui flutuaes nos harm-

    nicos e rudos, j o som de perodo amostrado possui espectro

    perfeitamente harmnico. . . . . . . . . . . . . . . . . . . . . . 47

    Figura 2.4 - Oscilao de 2 amostras (frequncia mxima em qualquer fa).

    O primeiro coeficiente reflete o deslocamento (offset ou bias) e

    o segundo coeficiente especifica a amplitude da oscilao. . . . 49

    Figura 2.5 - 3 amostras fixas apresentam uma s frequncia no nula. c1 = c2e w1 w2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

  • Figura 2.6 - Componentes frequenciais em 4 amostras. . . . . . . . . . . . . 51

    Figura 2.7 - Formas de onda bsicas em 4 amostras. . . . . . . . . . . . . . 52

    Figura 2.8 - Componentes frequenciais em 6 amostras: 3 senoides se somam

    ao bias. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    Figura 2.9 - Formas de onda bsicas em 6 amostras: as ondas triangular e

    quadrada possuem os harmnicos mpares, mas em propores

    e fases diferentes; a dente de serra possui tambm o harmnico

    par. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    Figura 2.10 - Deteco de localizao espacial de fonte sonora: esquema uti-

    lizado para clculo da diferena de tempo interaural (DTI) e da

    diferena de intensidade interaural (DII). . . . . . . . . . . . . . 55

    Figura 2.11 - Mixagem de trs sequncias sonoras. As amplitudes so sobre-

    postas diretamente. . . . . . . . . . . . . . . . . . . . . . . . . 60

    Figura 2.12 - Concatenao de trs sequncias sonoras atravs da justaposio

    temporal de suas amostras. . . . . . . . . . . . . . . . . . . . . 61

    Figura 2.13 - Procedimento de busca em tabela (conhecido como Lookup Ta-

    ble) para sntese de sons em frequncias diferentes a partir de

    uma nica forma de onda em alta resoluo. . . . . . . . . . . . 64

    Figura 2.14 - Transies de intensidade para diferentes valores de (veja equa-

    es 2.39 e 2.40). . . . . . . . . . . . . . . . . . . . . . . . . . 67

    Figura 2.15 - Interpretao grfica da convoluo. Cada amostra resultante

    a soma das amostras anteriores de um sinal uma a uma multipli-

    cadas pelas amostras retrgradas do outro sinal. . . . . . . . . . 70

  • Figura 2.16 - Convoluo com o impulso: deslocamento (a), linhas de delays

    (b) e sntese granular (c). Dispostos em ordem crescente de den-

    sidade de pulsos. . . . . . . . . . . . . . . . . . . . . . . . . . 72

    Figura 2.17 - Mdulos da resposta em frequncia (a), (b), (c) e (d) respectiva-

    mente dos filtros IIR das equaes 2.45, 2.46, 2.48 e 2.49 para

    diferentes frequncias de corte, frequncias centrais e larguras

    de banda. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

    Figura 2.18 - Rudos coloridos realizados atravs das equaes 2.50, 2.51, 2.52,

    2.53, 2.54: espectros e ondas sonoras resultantes. . . . . . . . . 77

    Figura 2.19 - Espectrograma de um som com vibrato senoidal de 3Hz e pro-

    fundidade de uma oitava em uma dente de serra de 1000Hz (con-

    siderada fa = 44.1kHz). . . . . . . . . . . . . . . . . . . . . . . 81

    Figura 2.20 - Tremolo de profundidade VdB = 12dB com padro oscilatrio de

    uma dente de serra em f = 1.5Hz em uma senoide de f = 40Hz

    (considerada taxa de amostragem fa = 44,1kHz). . . . . . . . . 83

    Figura 2.21 - Envoltria ADSR (Attack, Decay, Sustain, Release) e uma sequn-

    cia sonora arbitrria submetida envoltria. A variao linear de

    amplitude est acima. Abaixo a variao de amplitude expo-

    nencial. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

  • Tabela 2.22 - Intervalos musicais, suas notaes tradicionais, classificaes

    bsicas de dissonncia e nmero de semitons. As consonncias

    perfeitas so os unssonos, as quintas e as oitavas justas (J). As

    consonncias imperfeitas so as teras e as sextas maiores (M) e

    menores (m). As dissonncias fortes so as segundas menores e

    stimas maiores. As dissonncias brandas so as segundas mai-

    ores e as stimas menores. O primeiro caso especial consiste na

    quarta justa, que consonante perfeita se considerada uma in-

    verso da quinta justa, caso contrrio pode ser considerada uma

    dissonncia ou uma consonncia imperfeita. O segundo caso

    especial o trtono (4aum, 5dim, tri). Este consonante em

    algumas culturas. J para a msica tonal, o trtono indica domi-

    nante e busca sua resoluo em uma tera ou sexta e, por esta

    instabilidade, considerado intervalo dissonante. . . . . . . . . 97

    Tabela 2.23 - Resumo das funes harmnicas tonais para a escala maior. A

    tnica o centro da msica, a dominante tende tnica e a sub-

    dominante se distancia da tnica. Os trs acordes podem, a prin-

    cpio, serem substitudos livremente pelas respectivas relativas

    ou anti-relativas. . . . . . . . . . . . . . . . . . . . . . . . . . . 106

    Figura 2.24 - Movimentos diferenciados pelo contraponto com vistas a pre-

    servar a independncia entre as vozes. 3 tipos de movimentos:

    direto, contrrio e oblquo, categorizam as possibilidades. O mo-

    vimento paralelo um tipo de movimento direto. . . . . . . . . 109

    Tabela 2.25 - Transio das duraes ouvidas individualmente para alturas. . . 110

  • Figura 2.26 - Divises e aglomeraes do pulso musical para estabelecimento

    de mtrica. Ao lado esquerdo esto as divises da semnima es-

    tabelecida como pulso. Ao lado direito, frmulas de compasso

    que especificam as mesmas mtricas, mas na escala das aglome-

    raes do pulso musical. . . . . . . . . . . . . . . . . . . . . . 111

    Figura 2.27 - Distines cannicas do clmax musical em uma melodia e ou-

    tros domnios. As possibilidades diferenciadas so: clmax no

    comeo, clmax na primeira metade, clmax no meio, clmax na

    segunda metade, clmax no fim. No est especificado o eixo das

    ordenadas pois pode no haver variao paramtrica real, neste

    caso a estrutura uma referncia. . . . . . . . . . . . . . . . . . 117

    Tabela 2.28 - Change Ringing: Peal (padro) com 3 sinos. As permutaes es-

    to entre as ordenaes. Cada linha uma ordenao dos sinos,

    cada ordenao tocada, uma linha por vez. . . . . . . . . . . . 119

  • LISTA DE RELAES ANALTICAS

    DESCRITAS E IMPLEMENTADAS

    COMPUTACIONALMENTE NO

    APNDICE A

    Equao 2.1 - Sequncia de amostras de um udio PCM.

    Equao 2.2 - Potncia.

    Equao 2.3 - Decibels entre dois udios.

    Equao 2.4 - Amplitude dobrada em decibels.

    Equao 2.5 - Potncia dobrada em decibels.

    Equao 2.7 - Variao de amplitude no volume dobrado (10 dBs).

    Equao 2.8 - Converso de decibels em variao de amplitude.

    Equao 2.9 - Representao bsica de uma sequncia peridica.

    Equao 2.10 - Sequncia infinita senoidal.

    Equao 2.11 - Sequncia infinita de uma onda dente de serra.

    Equao 2.12 - Sequncia infinita de uma onda triangular.

  • Equao 2.13 - Sequncia infinita de uma onda quadrada.

    Equao 2.14 - Sequncia infinita de uma forma de onda sampleada.

    Equao 2.15 - Recomposio das amostras temporais com base nos coeficientes espec-

    trais.

    Equao 2.16 - Recomposio das amostras temporais reais em termos do mdulo e fase.

    Equao 2.17 - Nmero de pares de coeficientes relativos mesma frequncia.

    Equao 2.18 - Coeficientes equivalentes em termos das frequcias que representam.

    Equao 2.19 - Equivalncias dos mdulos dos coeficientes espectrais.

    Equao 2.20 - Equivalncias das fases dos coeficientes espectrais.

    Equao 2.21 - Reconstruo das amostras temporais em termos dos coeficientes pareados

    e independentes.

    Equao 2.22 - Nota bsica com durao, frequncia e altura.

    Equao 2.23 - Forma de onda sinttica ou amostrada.

    Equao 2.24 - Nota bsica com forma de onda especificada.

    Equao 2.25 - Distncia de uma fonte sonora a cada ouvido.

    Equao 2.26 - Diferena de Tempo Interaural (DTI).

    Equao 2.27 - Diferena de Intensidade Interaural (DII).

    Equao 2.28 - Sequncia binaural PCM com DTI e DII para localizao espacial.

    Equao 2.29 - ngulo resolvido pela implementao da DTI e DII.

  • Equao 2.30 - Mixagem de N sequncias.

    Equao 2.31 - Concatenao de N sequncias.

    Equao 2.32 - Procedimento de busca em tabelas (Lookup Table).

    Equao 2.33 - Frequncias em cada amostra em uma variao linear.

    Equao 2.34 - ndices para busca na tabela em uma variao linear de frequncia.

    Equao 2.35 - Sequncia amostral em uma variao linear de frequncias.

    Equao 2.36 - Frequncias em cada amostra em uma variao exponencial.

    Equao 2.37 - ndices para busca na tabela em uma variao exponencial de frequncia.

    Equao 2.38 - Sequncia amostral em uma variao exponencial de frequncias.

    Equao 2.39 - Sequncia de amplitudes em uma variao exponencial.

    Equao 2.40 - Sequncia amostral em uma variao exponencial de amplitude.

    Equao 2.41 - Sequncia de amplitudes em uma variao linear de amplitude.

    Equao 2.42 - Sequncia amostral em uma variao exponencial de amplitude dada em

    decibels.

    Equao 2.43 - Convoluo de sequncias reais e finitas.

    Equao 2.44 - Equao a diferenas para aplicao temporal de filtros IIR.

    Equao 2.45 - Coeficientes de um filtro passa-baixas bem comportado de primeira ordem

    com frequncia de corte varivel.

    Equao 2.46 - Coeficientes de um filtro passa-altas bem comportado de primeira ordem

    com frequncia de corte varivel.

  • Equao 2.47 - Variveis auxiliares de um filtro n de segunda ordem.

    Equao 2.48 - Coeficientes de um filtro passa-banda de segunda ordem com frequncia

    central e largura de banda variveis.

    Equao 2.49 - Coeficientes de um filtro rejeita-banda de segunda ordem com frequncia

    central e largura de banda variveis.

    Equao 2.50 - Coeficientes espectrais para sntese de rudo branco.

    Equao 2.51 - Coeficientes espectrais para sntese de rudo rosa.

    Equao 2.52 - Coeficientes espectrais para sntese de rudo marrom.

    Equao 2.53 - Coeficientes espectrais para sntese de rudo azul.

    Equao 2.54 - Coeficientes espectrais para sntese de rudo violeta.

    Equao 2.55 - Coeficientes espectrais para sntese de rudo preto.

    Equao 2.56 - ndices auxiliares para um vibrato de frequncia varivel.

    Equao 2.57 - Expoentes auxiliares para um vibrato de frequncia varivel.

    Equao 2.58 - Frequncias por amostra de um vibrato de frequncia e profundidade va-

    riveis.

    Equao 2.59 - ndices um vibrato de frequncia e profundidade variveis.

    Equao 2.60 - Amostras de um udio com vibrato de frequncia e profundidade vari-

    veis.

    Equao 2.61 - Amplitudes por amostra de um tremolo de frequncia e profundidade va-

    riveis.

  • Equao 2.62 - Amostras de um udio com tremolo de frequncia e profundidade vari-

    veis.

    Equao 2.63 - Espectro da sntese FM.

    Equao 2.65 - Espectro da sntese AM.

    Equao 2.66 - ndices auxiliares para sntese FM.

    Equao 2.67 - Sequncia auxiliar para sntese FM.

    Equao 2.68 - Sequncia de frequncias para cada amostra para sntese FM.

    Equao 2.69 - ndices para sntese FM.

    Equao 2.70 - Sequncia amostral resultante da sntese FM.

    Equao 2.71 - Sequncia de amplitudes por amostra na sntese AM.

    Equao 2.72 - Sequncia amostral resultante da sntese AM.

    Equao 2.73 - Exemplo de vnculo entre a frequncia e parmetros do tremolo e do vi-

    brato em um som.

    Equao 2.74 - Equao bsica da frequncia observada no efeito Doppler.

    Equao 2.75 - Amplitude observada no efeito Doppler.

    Equao 2.76 - Frequncia efetiva observada no efeito Doppler.

    Equao 2.77 - Primeiro perodo de uma reverberao.

    Equao 2.78 - Segundo perodo de uma reverberao.

    Equao 2.79 - Resposta ao impulso de uma reverberao.

  • Equao 2.80 - Envoltria ADSR com variaes lineares e logartmicas.

    Equao 2.81 - Aplicao da envoltria ADSR em uma sequncia arbitrria.

    Equao 2.22 - Intervalos musicais em nmero de semitons.

    Equao 2.82 - Escalas simtricas na oitava divida em 12 notas.

    Equao 2.83 - Escalas diatnicas.

    Equao 2.84 - Sucesso de intervalos em uma escala diatnica.

    Equao 2.85 - Escalas menores natural, harmnica e meldica.

    Equao 2.86 - Trades maior, menor, diminuta e aumentada.

    Subseo 2.3.1 - Relaes microtonais atravs de fraes de semitons ou atravs de quanti-

    dades inteiras de divises arbitrrias da oitava.

    Subseo 2.3.2 - Relaes bsicas de harmonia tonal.

    Subseo 2.3.3 - Regras bsicas de conduo de vozes com independncia.

    Subseo 2.3.4 - Relaes bsicas de mtrica e rtmica.

    Subseo 2.3.6 - Formao de arcos musicais atravs de estruturas direcionais.

    Subseo 2.3.7 - Estruturas cclicas para a sntese musical.

  • Elementos de notao

    Hz abreviao de Herz, medida de frequncia, nmero de ocorrncias por segundo.

    kHz abreviao de kilo Hertz, i.e. mil Herz.

    m metro.

    mm milmetro.

    s segundo.

    m/s metros por segundo.

    fa frequncia de amostragem, taxa de amostragem.

    a durao da separao temporal entre um par de amostras consecutivas.

    PCM sigla de Pulse Code Modulation, veja seo 1.1

    S i sequncia S indexada em i.

    {si}yx sequncia com elementos si com ndices de x a y incluso.

    bxc parte inteira de x.

    VdB volume em decibels.

    ento.

    portanto.

  • : tal que.

    para todo.

    aproximadamente.

    equivalente.

    % operao mdulo, resto da diviso.

    comprimento em amostras.

    comprimento em amostras de perodo de onda.

    durao temporal.

    ai fator multiplicativo de amplitude da i-sima amostra.

  • Sumrio

    1 Introduo 33

    1.1 Som em udio digital . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

    1.2 Arte sonora e teoria musical . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    1.3 Implementao computacional . . . . . . . . . . . . . . . . . . . . . . . . . . 36

    1.4 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    1.5 Trabalhos relacionados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    2 Msica no som digitalizado 39

    2.1 Caracterizao da nota musical em tempo discreto . . . . . . . . . . . . . . . . 39

    2.1.1 Durao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    2.1.2 Volume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

    2.1.3 Altura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    2.1.4 Timbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

    2.1.5 O espectro no som amostrado . . . . . . . . . . . . . . . . . . . . . . . 47

    2.1.6 A nota bsica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

    2.1.7 Localizao espacial e espacializao . . . . . . . . . . . . . . . . . . 54

  • 2.1.8 Usos musicais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

    2.2 Variaes na nota musical bsica . . . . . . . . . . . . . . . . . . . . . . . . . 63

    2.2.1 Tabela de busca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

    2.2.2 Variaes incrementais de frequncia e intensidade . . . . . . . . . . . 65

    2.2.3 Aplicao de filtros digitais . . . . . . . . . . . . . . . . . . . . . . . . 69

    2.2.4 Rudos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

    2.2.5 Tremolo e vibrato, AM e FM . . . . . . . . . . . . . . . . . . . . . . . 80

    2.2.6 Usos musicais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

    2.3 Organizao de notas em msica . . . . . . . . . . . . . . . . . . . . . . . . . 95

    2.3.1 Afinao, intervalos, escalas e acordes . . . . . . . . . . . . . . . . . . 95

    2.3.2 Harmonias atonal, tonal, expanso e modulao . . . . . . . . . . . . . 103

    2.3.3 Contraponto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

    2.3.4 Ritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

    2.3.5 Repetio e variao: motivos e unidades maiores . . . . . . . . . . . . 113

    2.3.6 Estruturas direcionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

    2.3.7 Estruturas cclicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

    2.3.8 Idioma musical? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120

    2.3.9 Usos musicais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

    3 Concluses e trabalhos futuros 123

  • REFERNCIAS 125

    Apndice A -- Cdigo computacional dos procedimentos expostos no captulo 2 133

    A.1 Cdigo Python das relaes descritas na seo 2.1 . . . . . . . . . . . . . . . . 133

    A.2 Cdigo Python das relaes descritas na seo 2.2 . . . . . . . . . . . . . . . . 138

    A.3 Cdigo Python das relaes descritas na seo 2.3 . . . . . . . . . . . . . . . . 150

    Apndice B -- Cdigo Computacional das Peas Musicais 157

    B.1 Peas referentes seo 2.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

    B.1.1 Quadros sonoros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

    B.1.2 Reduced-fi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161

    B.2 Peas referentes seo 2.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

    B.2.1 Transita para metro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

    B.2.2 Vibra e treme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

    B.2.3 Tremolos, vibratos e a frequncia . . . . . . . . . . . . . . . . . . . . . 167

    B.2.4 Trenzinho de caipiras impulsivos . . . . . . . . . . . . . . . . . . . . . 167

    B.2.5 Ruidosa faixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

    B.2.6 Bela Rugosi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

    B.2.7 Chorus infantil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

    B.2.8 ADa e SaRa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

    B.3 Peas referentes seo 2.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

  • B.3.1 Intervalos entre alturas . . . . . . . . . . . . . . . . . . . . . . . . . . 177

    B.3.2 Cristais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177

    B.3.3 Micro tom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

    B.3.4 Acorde cedo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

    B.3.5 Conta ponto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

    B.3.6 Poli Hit Mia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

    B.3.7 Dirracional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183

    Apndice C -- Finite Groups in Granular and Unit Synthesis e a sntese de um EP 187

    C.1 FIGGUS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

    C.1.1 FIGGUS.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

    C.1.2 tables.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

    C.1.3 __init__.py . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

    C.2 PPEPPS: msicas de um EP solvente . . . . . . . . . . . . . . . . . . . . . . . 188

    C.2.1 RUNME make EP MUSIC.py . . . . . . . . . . . . . . . . . . . . . . 188

    C.2.2 ter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

    C.2.3 Benzina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

    C.2.4 Clorofrmio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

    Apndice D -- Sntese FM e AM em escala logartmica 199

    Apndice E -- Anlise sonora e musical 201

  • E.1 Espectro em frequncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

    E.2 Eventos no tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

    E.3 Anlise de partituras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202

    Apndice F -- Msica digital em domnios no digitais 203

    F.1 Experimentos abertos em udio: LADSPAs, Wavelets e Redes Complexas . . . 203

    F.2 udio e msica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206

    F.2.1 Msica em tempo diferido: minimum-fi e FIGGUS . . . . . . . . . . . 206

    F.2.2 Msica em tempo real: Livecoding e ABeatTracker (ABT) . . . . . . . 217

    F.2.3 Msica na matria: EKP e AHT . . . . . . . . . . . . . . . . . . . . . 224

    F.2.4 Msica no tecido social: Sabrina Kawahara, Audioexperiments, Estu-

    dioLivre.org, CDTL, juntaDados.org, Devolts.org, MSST, LabMacam-

    bira.sf.net . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226

    F.3 Materiais didticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

    F.3.1 Tutoriais em texto e cdigo: python, filtros e nyquist, plugins lv2, me-

    trics, carta mdias livres, contra-cultura digital . . . . . . . . . . . . . 229

    F.3.2 Screencasts e outros materiais em video . . . . . . . . . . . . . . . . . 232

    F.4 Web . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233

    F.4.1 Tecnologias sociais: Stios, Contedos e Articulao . . . . . . . . . . 233

    F.5 Momento atual e previses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236

  • Apndice G -- Trabalhos relacionados e caracterizao das contribuies deste tra-

    balho 239

    G.1 Livros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 240

    G.2 Bibliotecas, linguagens e conjuntos de implementaes computacionais volta-

    dos para msica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249

    G.3 Aprofundamento sobre esta dissertao com base nos trabalhos visitados nas

    subsees G.1 e G.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253

  • 33

    1 Introduo

    "Tradicionalmente a notao musical

    vista como um cdigo atravs do qual

    sons, ideias musicais ou indicaes para

    execuo musical so registrados sob

    forma escrita."

    Edson S. Zampronha.(1)

    Representar estruturas e artifcios musicais atravs das caractersticas do som discretizado a

    proposta deste trabalho. Os resultados so relaes matemticas e suas implementaes com-

    putacionais. Uma descrio terica est no captulo 2 e o conjunto de scripts disponibilizados

    no Apndice A e online. A caixa de ferramentas (toolbox) recebeu o nome massa (msica e

    udio em sequncias e sries amostrais) e foi utilizada para fazer pequenas peas e montagens

    focadas nos princpios expostos. O Apndice B possui uma relao destas montagens assim

    como o diretrio exemplos_de_uso da massa.(2)

    1.1 Som em udio digital

    O som uma onda mecnica longitudinal de presso. A banda de frequncias compreendida

    entre 20Hz e 20kHz apreciada pelo aparelho auditivo humano com variaes dependentes

    da pessoa, das condies climticas e do som em si. Considerada a velocidade do som no ar

  • 34

    343.2m/s, estes limites correspondem respectivamente aos comprimentos de onda 343.220 =17.16m e 343.220000 = 17.16mm.(3)

    A percepo humana do som envolve captaes pelos ossos, estmago e orelha, funes de

    transferncia da cabea e dorso e processamento pelo sistema nervoso. Alm disso, o ouvido

    um rgo dedicado captura destas ondas. Seu funcionamento decompe o som em seu

    espectro senoidal e passa para o sistema nervoso.(3) Estas componentes senoidais so cruciais

    para os fenmenos musicais, como se pode observar tanto na composio dos sons de interesse

    para a msica quanto nas afinaes e escalas.(4) A subseo 2.1 expe a presena de senoides

    no som discretizado e caracteriza a nota musical bsica.

    A representao do som o udio1 e este pode provir da captura do som por microfones ou

    da sntese. Muitas vezes, o udio digital especificado atravs de protocolos que facilitam o

    armazenamento e transferncia dos arquivos. A representao digital do som pode consistir em

    amostras igualmente espaadas no tempo e cujas amplitudes individuais so registradas com

    um mesmo nmero de bits. Estas amostras separadas por intervalos regulares a constituem a

    forma padro de representao do som em tempo discreto, chamada de modulao por cdigo

    de pulsos (PCM do ingls Pulse Code Modulation). Um som digital PCM caracterizado pela

    frequncia de amostragem fa = 1a , tambm chamada de taxa de amostragem, e a profundidade

    de bit que o nmero de bits utilizados para representar a amplitude de cada amostra. A

    figura 1.1 exibe 25 amostras de um udio PCM com 4 bits cada. Os 24 = 16 grados para a

    amplitude de cada amostra junto ao espaamento regular a introduzem um erro de quantizao.

    O rudo causado por estes erros diminuem com a diminuio destes espaamentos.(6)

    Pelo teorema de Nyquist, constata-se que a metade da frequncia de amostragem a frequncia

    mxima do sinal. Assim, para apreender as frequncias audveis, necessria uma taxa de

    amostragem que seja ao menos o dobro da frequncia mais aguda fa 220kHz = 40kHz. Este

    1 Os termos som e udio so muitas vezes usados de forma intercambivel.(5)

  • 35

    Figura 1.1 Som digital em modulao por cdigo de pulsos (PCM): 25 amostras representadas por 4bits cada uma.

    raciocnio est na base da utilizao das frequncias de amostragem fa = 44.1kHz e fa = 48kHz,

    ambas padro em Compact Disks (CDs) e em sistemas de Rdio e TV, respectivamente.(6)

    1.2 Arte sonora e teoria musical

    A msica definida como a arte manifesta pelos sons e silncios. Para um ouvinte comum -

    e boa parte dos especialistas - uma msica que seja msica pressupe tambm uma mtrica

    rtmica e organizaes de alturas que formem melodias e harmonias como explicadas na se-

    o 2.3. A msica do sculo XX ampliou esta concepo tradicional de msica. Isso ocorreu

    na msica de concerto, especialmente nas correntes concreta, eletrnica e eletroacstica. J na

    dcada de 90 era evidente que tambm a msica popular, especialmente as msicas eletrnicas

    de dana, tinham incorporado sons sem altura definida e organizaes temporais fora de mtri-

    cas simples. Mesmo assim, a nota permanece paradigmtica como unidade fundamental das

    estruturas musicais e, na prtica, pode se desdobrar em sons que contemplam estes desenvol-

  • 36

    vimentos recentes. A definio e expanso da nota como unidade fundamental da msica so

    abordados nas sees 2.2 e 2.1, respectivamente. A seo 2.3 trata da organizao das notas em

    estruturas de alto nvel.(711)

    A teoria musical engloba assuntos to diversos quanto psico-acstica, manifestaes culturais

    e formalismos. O texto do captulo 2 aborda estes assuntos mediante necessidade e assinala

    complementos externos.(1214)

    1.3 Implementao computacional

    Os resultados apresentados desta dissertao incluem scripts, i.e. pequenos programas para

    melhor disponibilidade e validao das tecnologias. Estes constituem a caixa de ferramentas

    massa, disponibilizada em domnio pblico atravs de repositrios Git abertos.(15) Os scripts

    esto em Python e fazem uso das bibliotecas externas Numpy e Scikits/Audiolab que realizam

    chamadas linguagem Fortran para maior eficincia computacional. Parte deste cdigo foi

    transcrita para JavaScript e Python nativos com facilidade, o que aponta para um uso destas

    contribuies em navegadores como o Firefox e o Chromium.(1619)

    Estas tecnologias so todas abertas, i.e. esto publicadas em licenas que permitem o uso, cpia,

    distribuio e utilizao de quaisquer partes para estudo e gerao de produtos derivados. Desta

    forma, o trabalho aqui descrito est disponvel e facilita os processos de co-autoria2.

    2 A comunidade e movimento chamada Open Source entende a publicao de cdigo computacional (e outrastecnologias) em licenas abertas como uma vantagem pragmtica que facilita o desenvolvimento de softwaree apresenta vantagens pedaggicas e mercadolgicas. A comunidade e movimento chamada Free Softwareengloba este entendimento, mas adiciona a abordagem filosfica da liberdade e compartilhamento, dando nfasea isso. Ambas as correntes reforam o entendimento de que o cdigo computacional o bem mais preciosoproduzido atualmente pois consiste em tecnologia condensada, reativa (executa, processa ou gera resultados),modular (partes so copiadas e reutilizadas eficientemente) e replicada sem custo adicional (a cpia de texto temcusto baixssimo).(20, 21)

  • 37

    1.4 Objetivos

    O objetivo principal desta dissertao apresentar de forma unificada relaes entre elementos

    bsicos da msica e as sequncias amostrais do udio PCM. O captulo seguinte um texto

    conciso em que os elementos musicais so apresentados junto s amostras temporais resultan-

    tes. Para validao e compartilhamento, as implementaes em cdigo computacional destas

    relaes e de pequenas peas musicais3 foram reunidas em uma toolbox chamada massa e

    disponibilizadas online e parcialmente nos Apndices A e B.

    Dos objetivos secundrios, destaca-se a difuso da compreenso do cdigo computacional atra-

    vs de prticas ldicas, no caso a msica. Outro objetivo considerado a apresentao de um

    arcabouo de sntese sonora e musical com controle amostral, para o qual h potenciais usos

    em experimentos psico-acsticos e sntese em alta definio (hi-fi). Tambm considerada a

    apresentao destes contedos de forma didtica, quase um tutorial, o que possibilita compre-

    enso e uso facilitados. Esta exposio amistosa faz-se significativa pois os assuntos tratados

    so de reconhecida complexidade: processamento de sinais, msica, psico-acstica, para citar

    somente alguns exemplos. Deste ponto de vista pedaggico, tambm se presta a apresentao

    destes resultados na forma de hipertexto, em que cada script e exemplo sonoro/musical seja

    acessvel junto ao material terico.

    1.5 Trabalhos relacionados

    Dado o interesse humano pela msica e a multidisciplinaridade inerente a esta dissertao, os

    trabalhos relacionados so numerosos. Assim, o Apndice G dedicado aos livros e imple-

    mentaes computacionais de interesse ou que apresentem similaridades com a descrio de

    elementos musicais em termos do udio digital. No h nfase em artigos pois foram poucos os

    3 Ou, de forma menos pretensiosa, montagens musicais, sequncias musicais.

  • 38

    encontrados. A visita indica aspectos inditos deste trabalho, em especial a descrio analtica

    de elementos musicais bsicos em termos das amostras sonoras e a descrio natural, formal e

    concisa de tcnicas tradicionais da msica.

  • 39

    2 Msica no som digitalizado

    The increasing dominance of graphic interfaces for music software obscured the conti-

    nuing presence of the command-line tradition, the code writer, the hacker. The code writing

    of deferred time computer programming may be assembled out of time order, debugged and

    optimized.

    Simon Emmerson, Living electronic music.(22)

    2.1 Caracterizao da nota musical em tempo discreto

    Em diversos contextos artsticos e tericos, a msica pensada atravs de unidades chamadas

    notas e estas unidades compreendidas como "tomos" constituintes da msica.(7, 8, 23) Hoje,

    estas notas so tidas como um paradigma de proposta musical e, de um ponto de vista cognitivo,

    como discretizaes que facilitam e enriquecem o fluxo de informao atravs da msica.(3,

    11) Canonicamente, as notas possuem ao menos durao, volume, altura e timbre.(11) Estas

    so qualidades tratveis quantitativamente e ditadas pelas amostras, igualmente espaadas no

    tempo, da onda sonora (veja seo 1.1 sobre udio PCM).(3)

    Todas as relaes desta seo esto no Apndice A.1, as montagens musicais Quadros sonoros e

    Reduced-fi esto nos Apndices B.1.1 e B.1.2. Estas implementaes esto tambm disponveis

    online como parte do toolbox massa.(2)

  • 40

    2.1.1 Durao

    A frequncia (ou taxa) de amostragem fa definida como o nmero de amostras por segundo.

    Seja a sequncia Ti = {ti} um conjunto ordenado de amostras reais separadas por a = 1/ fa se-gundos. Uma nota musical de durao se apresenta como uma sequncia de b. fac amostras1:

    T i = {ti}b. fac1i=0 (2.1)

    Seja = b. fac o nmero de amostras da sequncia, de forma que Ti = {ti}10 .

    2.1.2 Volume

    A sensao de volume sonoro depende da reverberao e distribuio dos harmnicos, dentre

    outras caractersticas trabalhadas na seo 2.2. Pode-se obter variaes do volume atravs da

    potncia da onda (24):

    pot(Ti) =1

    i=0 t2i

    (2.2)

    O volume final depender sempre da amplificao do sinal nos alto-falantes, assim o crucial

    a potncia relativa de uma nota em relao s outras ou de um trecho da msica em relao ao

    resto. As diferenas de volume so medidas em decibels, e estes so calculados diretamente

    com as amplitudes atravs das energias ou potncias2:

    VdB = 10log10pot(T

    i )

    pot(Ti)(2.3)

    1 O limite superior de uma sequncia um nmero natural, mas . fa s satisfaz esta condio em casos muitoexcepcionais. necessrio escolher um inteiro prximo de . fa e admitir algum erro. Por simplicidade, serconsiderada sempre a parte inteira da multiplicao, descrita por b. fac e aceito o erro de at a segundos. Porexemplo, a = 1/44100 2,3.105, por volta de 23 microssegundos, o que razovel para usos musicais.

    2 Lembrando que, devido percepo logartmica, em um som de volume v a reduo da potncia p para umamesma frao .p com [0,1] sentido como a mesma diminuio do volume v com 0.

  • 41

    A quantidade VdB possui a unidade decibel (dB). A cada 10 dB se atribui a sensao de "volume

    dobrado". Referncias teis so os 10dB por grado na escala de intensidades: pianissimo, piano,

    mezzoforte, forte e fortissimo. Valores ainda mais cruciais so equivalentes em dB de se dobrar

    a amplitude ou a potncia:

    se ti = 2.ti pot(T

    i ) = 4.pot(Ti) V

    dB = 10log104 6dB (2.4)

    se pot(Ti ) = 2pot(Ti) V

    dB = 10log102 3dB (2.5)

    e o ganho de amplitude necessrio para que uma sequncia tenha o volume dobrado (10dB a

    mais):

    10log10pot(T

    i )

    pot(Ti)= 10

    b. fac1i=0

    t2i = 10

    1i=0

    t2i =1i=0

    (

    10.ti)2 (2.6)

    ti =

    10ti ti 3,16ti (2.7)

    Ou seja, necessrio pouco mais que triplicar a amplitude para um volume dobrado. Estes

    valores servem de guia para os aumentos e diminuies dos valores absolutos que compem as

    sequncias de amostras sonoras com propsitos musicais. A converso direta de decibels em

    ganho ou atenuao de amplitude se d da seguinte forma:

    A = 10VdB20 (2.8)

    Onde A o fator multiplicativo que relaciona as amplitudes do sinal antes e depois da amplifi-

    cao.

  • 42

    2.1.3 Altura

    Recapitulando, a partcula musical (nota) uma sequncia Ti cuja durao e volume corres-

    pondem ao tamanho da sequncia e amplitude de suas amostras. A altura especificada pela

    frequncia fundamental f0 com ciclo de durao f0 = 1/ f0. Esta durao multiplicada pela

    frequncia de amostragem fa resulta no nmero de amostras do ciclo f0 = fa. f0 = fa/ f0.

    Por motivos didticos, seja f0 tal que divida fa e f0 resulte inteiro. Se Tf

    i uma sequncia

    sonora de frequncia fundamental f , ento:

    T fi ={t fi

    }=

    {t fi+ f

    }=

    {t fi+ faf

    }(2.9)

    Na seo seguinte sero contempladas frequncias f que no dividem fa e esta restrio no

    implica na perda de generalidade do contedo desta seo.

    2.1.4 Timbre

    Enquanto o perodo da onda corresponde a uma frequncia fundamental, o percurso da onda

    sonora dentro do perodo - chamado de forma de onda - define um espectro harmnico e portanto

    um timbre3. Musicalmente, importa que espectros sonoros com diferenas mnimas resultam

    em timbres com diferenas expressivamente cruciais e que, portanto, pode-se produzir timbres

    diferentes atravs de espectros diferentes.(3)

    O caso mais simples (e mais importante, como mostra o texto que segue) o do espectro que

    consiste somente em sua prpria fundamental f . Este o caso da senoide, frequncia em

    3 O timbre uma caracterstica subjetiva e complexa. Fisicamente, o timbre multidimensional e dado pelo com-portamento temporalmente dinmico de energias em componentes espectrais tanto harmnicas quanto ruidosas.Alm disso, a palavra timbre utilizada para designar coisas diferentes: uma mesma nota possui diferentes tim-bres, um mesmo instrumento possui diferentes timbres, dois instrumentos da mesma famlia possuem o mesmotimbre que a caracteriza mas possuem timbres diferentes porque so instrumentos diferentes. Vale salientar quenem tudo o que se atribui ao timbre se acha manifesto em diferenas espectrais e que at aspectos culturais oucircunstanciais alteram nossa percepo do timbre.

  • 43

    movimento oscilatrio puro chamado movimento harmnico simples. Seja S fi uma sequncia

    cujas amostras s fi descrevem uma senoide de frequncia f :

    S fi = {s fi } ={sin

    (2pi

    i f

    )}=

    {sin

    (2pi f

    ifa

    )}(2.10)

    Onde f =faf =

    fa

    o nmero de amostras do perodo4.

    De forma semelhante, outras formas de onda so utilizadas na msica por suas qualidades

    espectrais e simplicidade. Enquanto a senoide um ponto isolado no espectro, estas ondas

    apresentam cadeias de componentes harmnicas. As formas de onda especificadas nas equa-

    es 2.10, 2.11, 2.12 e 2.13 esto na figura 2.1. So as formas de onda artificiais tradicional-

    mente usadas na msica para sntese e controle oscilatrio de variveis e apresentam diversos

    usos tambm fora da msica.(25)

    A dente de serra apresenta todas as componentes da srie harmnica com energia decrescente

    de 6dB/oitava. A sequncia de amostras temporais pode ser descrita da seguinte forma:

    D fi ={d fi

    }=

    {2

    i% f f1

    }(2.11)

    A forma de onda triangular apresenta somente os harmnicos mpares caindo a 12dB/oitava:

    T fi ={t fi

    }=

    {1

    24 i% f f}

    (2.12)

    A onda quadrada apresenta somente os harmnicos mpares caindo a 6dB/oitava:

    Q fi ={q fi

    }=

    1 para (i% f ) < f /2

    1 caso contrrio(2.13)

    A dente de serra um ponto de partida comum para a sntese subtrativa pois possui ambos os

    4 Neste ponto j se tem toda a base para msica Reduced-fi do Apndice B.1.2.

  • 44

    harmnicos pares e mpares e em grande quantidade. Para fins musicais, estas formas de onda

    so excessivamente ricas em harmnicos agudos e uma filtragem atenuante nos mdios e agudos

    til para que o som ganhe naturalidade e fique mais agradvel. Os harmnicos relativamente

    atenuados da onda triangular a fazem a mais funcional - dentre as citadas - para ser usada sem

    nenhum tratamento na sntese de notas musicais.

    J a onda quadrada pode ser usada na sntese subtrativa que vise a imitar um clarinete. Este

    instrumento tambm s apresenta os componentes mpares do espectro harmnico e a onda

    quadrada convm com sua energia abundante nas altas frequncias.

    Figura 2.1 Formas de onda musicais bsicas. As formas de onda sintticas esto em (a) e as formasde onda reais esto em (b).

    A figura 2.1 apresenta as formas de onda descritas nas equaes 2.10, 2.11, 2.12 e 2.13 para

    f = 100 (perodo de 100 amostras). Se ta = 44,1kHz, como no padro PCM de Compact Disks,

    a onda possui frequncia fundamental f = fa f =44100

    100 = 441 Herz. Um l5 seja qual for a forma

    de onda.

    5 Um l 4, logo acima do d central, no segundo espao do pentagrama na clave de sol comum.

  • 45

    O espectro de cada forma de onda bsica est na figura 2.2. As componentes isoladas e exa-

    tamente harmnicas dos espectros correspondem a um perodo rigorosamente fixo. A senoide

    consiste de um ndulo nico no espectro, frequncia pura. A dente de serra a nica com

    a srie harmnica completa (pares e mpares). J as ondas triangular e quadrada possuem as

    mesmas componentes espectrais, mas com decaimentos de 12dB/oitava e 6dB/oitava res-pectivamente.

    Figura 2.2 Espectros das ondas sonoras musicais artificiais bsicas. A senoide tem o espectro puntual,a triangular apresenta somente os harmnicos mpares, caindo a 6dB por oitava; a ondaquadrada tem somente os harmnicos mpares, caindo a 12dB por oitava; a onda dente deserra apresenta todos os harmnicos, caindo a 6dB por oitava.

    O espectro harmnico formado pelas frequncias mltiplas da frequncia fundamental fn =

    (n + 1). f0. Como a percepo humana de altura segue uma progresso geomtrica de frequn-

    cias, o espectro possui notas diferentes da frequncia fundamental. Alm disso, o nmero de

    harmnicos ser limitado pela frequncia mxima fa/2 (pelo Teorema de Nyquist).

    Musicalmente crucial aqui internalizar que a presena de energia em uma componente de

    frequncia fn significa uma oscilao na constituio do som, puramente harmnica e naquela

  • 46

    frequncia fn. Esta energia concentrada especificamente na frequncia fn separada pelo ou-

    vido para adentrar em um nvel cognitivo de processamento6. As componentes senoidais so

    geralmente as principais responsveis pela qualidade chamada timbre. Caso no se apresentem

    em propores harmnicas (relaes de pequenos nmeros), o som percebido como ruidoso

    ou dissonante e no com uma sonoridade de frequncia fundamental estabelecida de forma un-

    voca. Alm disso, a noo de altura absoluta em um complexo sonoro baseada na semelhana

    do espectro com a srie harmnica.(3)

    No caso de uma forma de onda fixa e de tamanho fixo, o espectro sempre harmnico e est-

    tico. Cada forma de onda composta de propores especficas das componentes harmnicas

    e quanto maior a curvatura do trecho na forma de onda, maior a contribuio do trecho para a

    concentrao de energia nos harmnicos agudos. Pode-se constatar isso em sons reais. A onda

    rotulada como som real amostrado na figura 2.1 um perodo de f = 114 amostras extrado

    de um som real relativamente comportado. A onda de obo foi amostrada de um l 4 tambm

    em 44,1kHz. O perodo escolhido para a amostragem relativamente curto, com 98 amostras

    corresponde a uma frequncia de 4410098 = 450Hz. Pode-se perceber, atravs das curvaturas, o

    espectro rico em frequncias agudas do obo e o espectro mais grave do som real.

    A sequncia Ri = {ri} f10 de amostras do som real da figura 2.1 pode ser tomada como basepara um som T fi da seguinte forma:

    T fi = {t fi } ={r(i% f )

    }(2.14)

    O som resultante possui o espectro momentneo do som original. Por ser repetido de forma

    idntica, seu espectro perfeitamente harmnico, sem os rudos e variaes tpicas do fen-

    meno natural. Isso pode ser visto na figura 2.3, que mostra os espectros da nota original do

    6 Esta separao em frequncia realizada por diversas espcies atravs de mecanismos similares cclea hu-mana.(3)

  • 47

    obo e de uma nota artificial de mesma durao e cujas amostras consistem no mesmo perodo

    da figura 2.1. O espectro natural possui variaes nas frequncias dos harmnicos, nas suas

    intensidades e uma quantidade de rudo. J a nota cujo perodo foi amostrado possui espectro

    perfeitamente harmnico.

    Figura 2.3 Espectros das ondas sonoras de uma nota de obo natural e de perodo amostrado. O somnatural possui flutuaes nos harmnicos e rudos, j o som de perodo amostrado possuiespectro perfeitamente harmnico.

    2.1.5 O espectro no som amostrado

    A presena e comportamento destas componentes senoidais no som discretizado possui parti-

    cularidades. Considere um sinal Ti e sua decomposio de Fourier F Ti = Ci = {ci}10 . Arecomposio a soma das componentes frequenciais em amostras temporais7:

    ti =1

    1k=0

    cke j2pik i =

    1

    1k=0

    (ak + j.bk)[cos(wki) + j.sen(wki)

    ](2.15)

    7 Lembrando que o fator 1

    pode ser distribudo dentre a transformada e a reconstruo como preferir.

  • 48

    Onde ck = ak + j.bk dita a amplitude e fase de cada frequncia: wk = 2pi k em radianos ou fk =

    wkfa2pi =

    fa

    k em Hertz,com ateno para os respectivos limites em pi e em fa2 dados pelo Teorema

    de Nyquist.

    No caso especfico de um sinal sonoro, as amostras ti so reais e dadas pela parte real da equao

    2.15:

    ti =1

    1k=0

    [akcos(wki)bksen(wki)]

    =1

    1k=0

    a2k + b

    2k cos

    [wki tg1

    (bkak

    )] (2.16)

    A equao 2.16 mostra que o termo imaginrio de ck acrescenta uma fase senoide real, i.e.

    os termos imaginrios bk da decomposio espectral por Fourier proporcionam a varredura de

    fase[pi2 ,+pi2

    ]dada pelo termo tg1

    (bkak

    )que possui esta imagem. O sinal de ak especifica o lado

    direito ou esquerdo do circulo trigonomtrico, o que completa a varredura de fase:[pi2 ,+pi2

    ][

    pi2 ,

    3pi2

    ] [2pi].

    A figura 2.4 exibe duas amostras e as componentes espectrais que contm. A decomposio

    de Fourier possui neste caso um nico par de coeficientes {ck = ak j.bk}1=10 relativos sfrequncias { fk}10 =

    {wk

    fa2pi

    }10

    ={k fa

    =2

    }10

    ={0, fa2 = fmx

    }com energias ek =

    (ck)2=2 . O papel das

    amplitudes ak ntido coma02 o deslocamento fixo

    8 e a12 a amplitude da oscilao em si, dada

    pela relao fk = kfa

    =2 . Este caso de especial importncia pois o mnimo necessrio para

    representar uma oscilao so 2 amostras e disso resulta a frequncia de Nyquist fmx =fa2 .

    Esta a frequncia mxima presente em um som amostrado com fa amostras por segundo9.

    Todas as sequncias fixas Ti de apenas 3 amostras tambm apresentam somente 1 frequncia,

    pois sua primeira harmnica usaria 1,5 amostras e ultrapassa o limite inferior de 2 amostras m-

    8 Chamado de bias ou offset.9 Qualquer sinal amostrado possui esta caracterstica, no somente o som digitalizado.

  • 49

    Figura 2.4 Oscilao de 2 amostras (frequncia mxima em qualquer fa). O primeiro coeficientereflete o deslocamento (offset ou bias) e o segundo coeficiente especifica a amplitude daoscilao.

    nimas, i.e. a frequncia da harmnica ultrapassaria a de Nyquist pois: 2. fa3 >fa2 . Os coeficientes

    {ck}1=20 apresentam-se em 3 componentes frequenciais. Uma delas relativa frequnciazero (c0), as outras duas (c1 e c2) contribuem de forma igual na reconstruo da senoide com

    f = fa/3.

    amostras reais ti resultam em coeficientes complexos ck = ak + j.bk. Os coeficientes ck se

    equivalem dois a dois correspondendo s mesmas frequncias e com contribuies idnticas10.

    Lembrando que fk = kfa, k

    {0, ...,

    2

    }. Quando k > 2 , a frequncia fk espelhada em

    fa2 da

    seguinte forma fk =fa2 ( fk fa2 ) = fa fk = fa k fa = ( k) fa fk fk , k < .

    O mesmo pode ser observado com wk = fk.2pifa e lembrando da periodicidade 2pi, que resulta em

    wk = wk. Como o coseno uma funo par e a tangente inversa impar, as componentes emwk e wk se somam na equao de reconstruo das amostras reais disposta na equao 2.15.

    10 Parte real igual e imaginria com sinal trocado: ak1 = ak2 e bk1 = bk2. Como consequncia os mdulos soiguais e as fases possuem sinais opostos

  • 50

    Figura 2.5 3 amostras fixas apresentam uma s frequncia no nula. c1 = c2 e w1 w2.

    Ou seja, em uma decomposio de amostras, as componentes frequenciais {ci}10 resul-tantes so equivalentes em pares. Exceo para f0 e, no caso de ser par, de f/2 = fmx =

    fa2 ,

    ambas as componentes so isoladas, i.e. no existe outra componente na frequncia f0 ou f/2

    (se par) alm dela mesma. Pois f/2 = f(/2)=/2 e f0 = f(0)= = f0. Alm disso, estas

    duas frequncias (a frequncia zero e a frequncia mxima) no so representadas com variao

    de fase e, portanto, so estritamente reais. Assim, pode-se concluir que o nmero de pares de

    coeficientes equivalentes :

    =%2

    2+%21 (2.17)

    e ficam evidentes as equivalncias 2.18, 2.19 e 2.20:

    fk fk , wk wk , 1 k (2.18)

  • 51

    Figura 2.6 Componentes frequenciais em 4 amostras.

    Como ak = ak e bk = bk:

    a2k + b

    2k =

    a2

    k + b2k , 1 k (2.19)

    tg1(bkak

    )= tg1

    (bkak

    ), 1 k (2.20)

    Com k N.

    A observao da equao de reconstruo para o sinal real 2.16 em conjunto com as equivaln-

    cias dos mdulos e fases 2.19 e 2.20, o nmero de coeficientes pareados 2.17 e equivalncia de

    pares de frequncias 2.18 expe o caso geral da combinao das componentes em cada amostra

    ti:

    ti =a0

    +2

    k=1

    a2k + b

    2k cos

    [wki tg1

    (bkak

    )]+

    a/2

    .(1%2) (2.21)

    Assim, a exemplo da figura 2.5, a transformada de Fourier de 3 amostras possui 2 coeficientes

  • 52

    Figura 2.7 Formas de onda bsicas em 4 amostras.

    frequenciais com quantidades iguais de energia na mesma frequncia.

    Com 4 amostras, pode-se representar 1 ou 2 frequncias em propores quaisquer. A figura 2.6

    mostra uma forma de onda de 4 amostras e suas duas componentes. As contribuies individuais

    se somam na forma de onda original, e uma breve inspeo revela que as curvaturas maiores so

    fruto da frequncia mais aguda, enquanto um deslocamento fixo da somatria das componentes

    advm da componente na frequncia zero.

    A figura 2.7 explicita os harmnicos em 4 amostras nas formas de onda bsicas das equaes

    2.10, 2.11, 2.12 e 2.13. Todas consistem em apenas 1 senoide, com exceo da dente de serra

    que possui os harmnicos pares.

    A figura 2.8 mostra uma decomposio senoidal para o caso de 6 amostras e a figura 2.9

    decompe as formas de onda bsicas. Neste caso todas as ondas se diferenciam no espectro:

    as quadrada e triangular possuem as mesmas componentes, mas em propores diferentes, j a

    dente de serra possui uma componente a mais.

  • 53

    Figura 2.8 Componentes frequenciais em 6 amostras: 3 senoides se somam ao bias.

    Figura 2.9 Formas de onda bsicas em 6 amostras: as ondas triangular e quadrada possuem osharmnicos mpares, mas em propores e fases diferentes; a dente de serra possui tambmo harmnico par.

    2.1.6 A nota bsica

    Seja f tal que f divida fa11. Uma sequncia Ti de amostras sonoras separadas por a = 1/ fa

    descreve uma nota musical de frequncia f Hertz e durao segundos se, e somente se, possuir

    11 Como apontado anteriormente, esta limitao facilita a exposio sem perda de generalidade. A limitao sersuperada no incio da prxima seo.

  • 54

    a periodicidade f = fa/ f e tamanho = b fa.c:

    T f , i = {ti% f }10 ={

    t fi %

    ( faf

    )}10

    (2.22)

    A nota por si s no especifica um timbre. Mesmo assim, faz-se necessria a escolha de uma

    forma de onda para que as amostras ti tenham um valor estabelecido individualmente. Um

    nico perodo dentre as ondas bsicas pode ser utilizado para a especificao da nota da seguinte

    forma:

    f =faf o nmero de amostras do perodo. Seja L

    f , fi a sequncia que descreve um perodo da

    onda L fi {S fi ,Q fi ,T fi ,D fi ,R fi } de durao f = 1/ f , dadas pelas equaes 2.10, 2.11, 2.12 e2.13 e onde R fi uma onda real amostrada:

    Lf , fi =

    {l fi} f . fa10

    ={l fi} f10

    (2.23)

    Ento a sequncia Ti consistir em uma nota de durao e frequncia f se:

    T f , i ={t fi

    }b fa.c10

    =

    {l fi%

    ( faf

    )}10

    (2.24)

    2.1.7 Localizao espacial e espacializao

    Embora no seja uma das quatro qualidades bsicas tradicionais de uma nota musical, esta

    possui sempre uma localizao espacial, que a posio da fonte que a emitiu, no espao fsico

    tridimensional ordinrio. Alm disso, h um ambiente que reverbera a nota emitida, assunto

    ao qual a espacializao dedicada. Ambas, a espacializao e a localizao espacial, so

    bastante valorizadas por audifilos e pela indstria fonogrfica.(4)

  • 55

    Localizao espacial

    Acredita-se que a percepo da localizao espacial do som se d em nosso sistema nervoso

    atravs destas trs informaes: o atraso de chegada do som entre um ouvido e o outro, a

    diferena de intensidade do som direto em cada ouvido e a filtragem realizada pelo corpo,

    incluindo trax, cabea e orelhas.(3, 26, 27)

    Figura 2.10 Deteco de localizao espacial de fonte sonora: esquema utilizado para clculo dadiferena de tempo interaural (DTI) e da diferena de intensidade interaural (DII).

    Se consideradas somente as incidncias diretas em cada ouvido, as equaes so simples. Dada

    a separao entre os ouvidos12, um objeto localizado em (x,y) conforme a figura 2.10 est

    distante de cada ouvido:

    d =

    (x

    2

    )2+ y2

    d =

    (x +

    2

    )2+ y2

    (2.25)

    e clculos imediatos resultam na Diferena de Tempo Interaural:

    12 Constata-se que 21,5cm para um humano adulto.

  • 56

    DT I =dd

    vsom no ar 343.2 segundos (2.26)

    e na Diferena de Intensidade Interaural:

    DII = 20log10

    (dd

    )decibels (2.27)

    Convertendo para amplitude, obtm-se DIIa = dd . A DIIa pode ser utilizada como constante

    multiplicativa do canal direito de um sinal sonoro estreo: {ti }10 = {DIIa.ti}10 . Pode-se utili-zar a DII junto DTI como adiantamento no tempo do canal direito com relao ao esquerdo,

    vnculo crucial para a localizao em sons graves e em sonoridades percussivas.(27) Conside-

    rando DT I = bDT I. fac:

    DT I =

    dd343,2

    fa

    DIIa =

    dd{

    t(i+DT I)}+DT I1DT I

    = {DIIa.ti}10{ti}DT I10

    = 0

    (2.28)

    Com ti o canal direito e ti o canal esquerdo. Caso DT I < 0, basta trocar ti por ti e utilizar

    DT I = |DT I |.

    Embora consideravelmente simples at aqui, a localizao espacial depende drasticamente de

    outras pistas. Pela DTI e DII especifica-se somente o ngulo horizontal (azimutal) dado por:

    = tan1(y

    x

    )(2.29)

    com x,y tais como representados na figura 2.10. Mesmo assim, h dificuldades quando in-

  • 57

    cide sobre o chamado "cone de confuso" em que um mesmo par de especificaes DTI, DII

    resultam de vrios dos pontos do cone. Nestes pontos, a inferncia do ngulo azimutal depende

    especialmente da filtragem atenuante nos agudos, pois a cabea interfere um tanto mais nas

    ondas mecnicas agudas do que nas graves.(26, 27) Tambm pertinente audio de fonte la-

    teral, quando o som grave o suficiente, h uma difrao e a onda chega ao ouvido 0,7msdepois.(4)

    A figura 2.10 mostra tambm esta sombra acstica do crnio, importante para a percepo do

    ngulo azimutal da fonte no cone de confuso. O cone em si no foi disposto na figura pois no

    exatamente um cone e suas dimenses precisas no foram encontradas na literatura visitada e

    no so facilmente concebveis, dadas as filtragens e a difrao dependente do espectro do som

    em si. De toda forma, o cone de confuso pode ser entendido como um cone com o pice no

    meio da cabea e saindo por cada uma das orelhas.(26)

    J a localizao completa, incluindo distncia e elevao da fonte sonora, dada pela funo de

    transferncia de cabea (HRTF - do ingls Head Related Transfer Function).(26) Existem bases

    abertas e conhecidas de HRTF como a CIPIC e pode-se aplicar estas funes de transferncia

    em um som por convoluo (veja equao 2.43).(28) O corpo do indivduo altera bastante as fil-

    tragens realizadas e existem tcnicas para gerar HRTFs que sejam - como proposta - utilizveis

    de forma universal.(29)

    Espacializao

    J a espacializao o resultado das reflexes e absores do som nas superfcies do recinto/pai-

    sagem no qual a nota foi emitida. O som se propaga no ar a 343,2m/s, e pode ser emitido dafonte com qualquer padro de direcionalidade. Quando uma frente sonora encontra uma super-

    fcie, h uma reflexo. Nesta reflexo ocorrem tanto 1) a inverso da componente da velocidade

    de propagao que perpendicular superfcie, quanto 2) a absoro de energia, especialmente

  • 58

    nos agudos. As ondas se propagam at atingirem nveis inaudveis. Quando alguma frente

    de onda atingir o ouvido, pode ser descrita com o momento de chegada ao ouvido e os filtros

    de absoro de cada superfcie que atingiu. Pode-se simular reverberaes no possveis em

    sistemas reais. Para experimentaes, pode-se usar reflexes assimtricas com relao ao eixo

    perpendicular superfcie, ou ainda ganhos em determinadas bandas de frequncia (tidos como

    ressonncias), ambas as caractersticas no so encontradas em sistemas reais.

    Existem algumas modelagens de reverberao menos atreladas ao clculo de cada reflexo,

    exploram informaes valiosas do ponto de vista auditivo. De fato, a reverberao pode ser

    modelada com um conjunto de 2 caractersticas temporais e no espectro:

    Primeiro perodo: as primeiras reflexes so mais intensas e esparsas.

    Segundo perodo: a reverberao tardia praticamente uma sucesso densa de atrasosindistintos com um decaimento exponencial e ocorrncias estatsticas.

    Primeira banda: o grave possui algumas frequncias de ressonncia relativamente espa-adas.

    Segunda banda: o mdio e agudo possuem um decaimento progressivo e suave com flu-tuaes estatsticas.

    Smith III aponta que boas salas de concerto possuem um tempo total de reverberao de aproxi-

    madamente 1,9 segundos. Aponta tambm o perodo das primeiras reflexes de 0,1 segundos.

    Estas quantidades sugerem que, nas condies contempladas, h frentes de onda perceptveis

    que se propagam at 652,08 metros (83,79k amostras em fa = 44,1kHz) antes de atingirem o

    ouvido. Alm disso, as reflexes do som formam, aps a propagao por 34,32 metros (4,41k

    amostras em fa = 44,1kHz ), um emaranhado cujas incidncias so pouco distintas na audi-

    o. Estas primeiras reflexes so particularmente importantes para a sensao de espao. A

  • 59

    primeira incidncia o som direto, descrito por DTI e DII das equaes 2.26 e 2.27. Admi-

    tindo que cada uma das primeiras reflexes, antes de chegar ao ouvido, se propagar, ao menos,

    3 30m dependentes das dimenses da sala, a separao entre as primeiras reflexes de, aomenos, 890 milissegundos ( 3504000 amostras em fa = 44.1kHz). Verifica-se experimen-talmente que o nmero de reflexes aumenta em proporo quadrtica k.n2. Apontamentosdo uso de convolues e filtragens para facilitar estas implementaes esto na subseo 2.2.6,

    especialmente nos pargrafos sobre reverberao.

    2.1.8 Usos musicais

    A partir da nota bsica, cabe realizar estruturas musicais com sequncias destas partculas. A

    soma dos elementos de mesmo ndice de N sequncias Tk,i = {tk,i}N1k=0 de mesmo tamanho resulta em seus contedos espectrais sobrepostos em um processo de mixagem sonora:

    {ti}10 =N1

    k=0

    tk,i

    1

    0

    (2.30)

    A figura 2.11 ilustra este processo de superposio de ondas sonoras discretizadas. A figura

    dispe 100 amostras, de onde pode-se concluir que, se fa = 44.1kHz, as frequncias da dente

    de serra, da onda quadrada e da senoide so, respectivamente, fa100/2 = 882Hz,fa

    100/4 = 1764Hz

    e fa100/5 = 2205Hz. A durao do trecho bastante curtofa=44.1kHz

    100 2 milissegundos. Bastacompletar com zeros para somar sequncias de tamanhos diferentes.

    As notas mixadas so em grande parte separadas pelo ouvido por leis fsicas de ressonncia e

    pelo sistema nervoso.(3) O resultado da mixagem de notas musicais a harmonia musical, cujos

    intervalos entre as frequncias e os acordes de notas simultneas regem aspectos subjetivos e

    abstratos da msica e sua apreciao.(30)

    As sequncias podem tambm ser concatenadas no tempo. Caso as sequncias {tk,i}k10 de

  • 60

    Figura 2.11 Mixagem de trs sequncias sonoras. As amplitudes so sobrepostas diretamente.

    tamanhos k representem k notas musicais, sua concatenao em uma nica sequncia Ti em

    uma sequncia musical simples ou melodia:

    {ti}

    k10 = {tl,i}

    k1

    0 , l menor inteiro : l > il1j=0

    j (2.31)

    Este mecanismo demonstrado de forma ilustrativa na figura 2.12 com as mesmas sequncias

    da figura 2.11. As sequncias so curtas para as taxas de amostragem usuais, mas pode-se

    observar a concatenao de sequncias sonoras. Alm disso, cada nota tem a durao maior

    que 100ms se fa < 1kHz.

    A montagem musical reduced-fi explora de forma isolada este uso de justaposio temporal das

    notas, resultando em uma pea homofnica. O princpio vertical est demonstrado nos quadros

    sonoros, sons estticos com espectros peculiares. Ambas as peas esto em cdigo Python nos

    Apndices B.1.1 e B.1.2 e esto disponveis como parte da toolbox massa.(2)

    Est descrita a nota musical digital bsica e a seo seguinte desenvolve a evoluo temporal

  • 61

    Figura 2.12 Concatenao de trs sequncias sonoras atravs da justaposio temporal de suas amos-tras.

    de seus contedos, como nos glissandi e nas envoltrias de volume. A filtragem de componen-

    tes espectrais e a gerao dos rudos completam a constituio da nota musical como unidade

    isolada e se desdobra na seo 2.3, dedicada estruturao destas notas em msica atravs de

    mtricas e trajetrias.

  • 62

  • 63

    2.2 Variaes na nota musical bsica

    A nota musical digital bsica foi definida na seo 2.1 com os parmetros: durao, altura,

    intensidade (volume) e timbre. Esta uma modelagem til e paradigmtica, mas no esgota o

    que se entende por uma nota musical.

    Em primeiro lugar, as caractersticas da nota se modificam no decorrer da prpria nota.(24) Por

    exemplo, uma nota de piano de 3 segundos tem a intensidade com incio abrupto e decaimento

    progressivo, alm de variaes do espectro, com harmnicos que decaem antes dos outros e

    alguns que aparecem com o tempo. Estas variaes no so obrigatrias e sim orientaes da

    sntese sonora para usos musicais, pois como os sons se apresentam na natureza13. Explorar

    todas as formas pelas quais estas variaes ocorrem est fora do escopo de qualquer trabalho

    dada a considervel sensibilidade do ouvido humano e a complexidade da nossa cognio so-

    nora. A seguir, sero apontados recursos primrios para estas variaes das caractersticas na

    nota bsica. Todas as relaes descritas nesta seo esto implementadas em Python no Apn-

    dice A.2. As montagens musicais Transita para metro, Vibra e treme, Tremolos, vibratos e

    a frequncia, Trenzinho de caipiras impulsivos, Ruidosa faixa, Bela rugosi, Chorus infantil,

    ADa e SaRa esto nos Apndices B.2.1, B.2.2, B.2.3, B.2.4, B.2.5, B.2.6, B.2.7 e B.2.8. Estes

    cdigos so parte da caixa de ferramentas massa, disponvel online.(2)

    2.2.1 Tabela de busca

    Mais conhecida pelo termo em ingls, a Lookup Table (ou simplesmente LUT), uma estrutura

    de dados para consultas indexadas usada frequentemente para reduzir a complexidade compu-

    tacional e por permitir o uso de funes sem possibilidade de clculo direto, como amostras

    recolhidas da natureza. Na msica seu uso transcende estes primeiros, facilitando as operaes

    13 A regra de ouro aqui : para que um som isolado desperte interesse por si s, faa com que tenha variaesinternas.(3)

  • 64

    e permitindo que um nico perodo de onda possa ser usado para sintetizar sons em toda a banda

    de frequncias audveis, qualquer que seja a forma de onda amostrada.

    Figura 2.13 Procedimento de busca em tabela (conhecido como Lookup Table) para sntese de sonsem frequncias diferentes a partir de uma nica forma de onda em alta resoluo.

    Seja o tamanho do perodo e Li ={li}10

    os elementos li de um perodo de onda qualquer

    (veja equao 2.23). Uma sequncia T f ,i com amostras de um som de frequncia f e durao

    pode ser obtida a partir de Li da seguinte forma:

    T f ,i ={t fi

    }b fa.c10

    ={li%

    }10

    , onde i =

    i. f fa (2.32)

    Ou seja, com os ndices corretos (i%) da LUT, pode-se sintetizar o som em qualquer frequn-

    cia. A figura 2.13 ilustra o clculo de uma amostra de {ti} a partir de{li}

    para uma frequncia

    de f = 200Hz, = 128 e considerada a taxa de amostragem em fa = 44.1kHz. Esta no

    uma configurao praticvel, como assinalado abaixo, mas possibilita uma disposio grfica

    do procedimento.

    O clculo do inteiro i introduz um rudo, e este diminui com o aumento de . Para fins de

  • 65

    sntese, em fa = 44.1kHz o padro usar = 1024 amostras, pois j no gera rudo relevante

    no espectro audvel. O mtodo de arredondamento ou interpolao no decisivo.(31)

    A expresso que define a varivel i pode ser compreendida da seguinte forma: i acrescida

    de fa a cada 1 segundo. Caso seja dividida pela frequncia de amostragem, resulta ifa , que

    acrescida de 1 a cada 1 segundo. Multiplicada pelo comprimento do perodo, resulta i fa

    que varre o perodo em 1 segundo. Por fim, com a frequncia f , resulta i. f fa que completa

    f varreduras do perodo em 1 segundo, i.e. a sequncia resultante apresenta a frequncia

    fundamental f .

    Importantes consideraes: f qualquer, s h limitantes nas frequncias graves quando o ta-

    manho da tabela no suficientemente grande para a taxa de amostragem fa. O procedimento

    de busca em tabela computacionalmente bastante barato, substituindo clculos por buscas

    simples (por isso geralmente entendido como um processo de otimizao). Salvo quando as-

    sinalado, no texto que usar este procedimento para todos os casos cabveis pois simplifica as

    rotinas e computacionalmente coerente.

    O uso de LUTs bastante difundido nas implementaes computacionais voltadas para msica

    e um uso clssico que explora com nfase as LUTs na sntese sonora musical, a chamada

    Wavetable Synthesis que consiste em vrias LUTs utilizadas em conjunto atravs da mixagem

    para gerar uma nota musical quasi-peridica. (10, 32).

    2.2.2 Variaes incrementais de frequncia e intensidade

    Segundo a lei de Weber e Fechner, a percepo humana tem uma relao logartmica com

    o estmulo que a causa.(33) Em outras palavras, um estmulo em progresso exponencial

    percebido como linear. Por razes didticas e dado o uso nas AM e FM (veja subseo 2.2.5),

    a variao linear ser abordada primeiro.

  • 66

    Em uma nota de durao = fa , a frequncia f = fi varia de f0 at f1 linearmente. Pode-se

    escrever:

    Fi = { fi}10 ={

    f0 + ( f1 f0) i1

    }10

    (2.33)

    i = fi

    fa i =

    ij=0

    f j

    fa

    = i

    j=0

    fa

    [f0 + ( f1 f0) j

    1] (2.34)

    {t f0, f1i

    }10

    ={li%

    }10

    (2.35)

    Onde i = fifa

    o incremento da LUT entre duas amostras dada a frequncia do som na

    primeira amostra.

    Desta forma, pode-se calcular os elementos t f0, f1i com base no perodo{li}10

    .

    As equaes 2.33, 2.34 e 2.35 so relativas progresso linear da frequncia. Como assinalado

    para o caso geral, tambm aqui uma progresso de frequncia percebida como linear segue uma

    progresso exponencial14. Pode-se escrever que: fi = f0.2i

    1 n8 onde n8 = log2f1

    f0 o nmero

    de oitavas entre f0 e f1. De forma que fi = f0.2i

    1 log2f1

    f0 = f0.2log2

    (f1

    f0

    ) i1

    = f0( f1

    f0

    ) i1 .

    Portanto, as equaes de transies de frequncia lineares para o ouvido so:

    Fi = { fi}10 = f0

    (f1

    f0

    ) i1

    1

    0

    (2.36)

    i = fi

    fa i =

    ij=0

    f j

    fa

    = i

    j=0

    f0

    fa

    (f1

    f0

    ) j1

    (2.37)14 Ou, dito ainda de outra forma, uma progresso geomtrica da frequncia percebida como uma progresso

    aritmtica de alturas.

  • 67

    {t f0, f1i

    }10

    ={li%

    }10

    (2.38)

    Figura 2.14 Transies de intensidade para diferentes valores de (veja equaes 2.39 e 2.40).

    O termo i1 varre o intervalo [0,1] e pode-se elev-lo a uma potncia para que o incio da

    transio seja mais suave ou abrupto. Este procedimento til para variaes de energia da

    onda vibratria para alterao do volume15. Basta multiplicar a sequncia original (seja ela

    gerada ou pr-estabelecida) pela sequncia a(

    i1

    )1 onde o coeficiente citado e a1 frao

    da amplitude original que se visa atingir ao final da transio.

    Assim, para variaes de amplitude:

    {ai}10 =a0

    (a1

    a0

    )( i1

    )1

    0

    =

    {(a1)

    (i

    1)}1

    0com a0 = 1 (2.39)

    15 A mudana do volume (qualidade psicofsica) ocorre atravs de diferentes caractersticas do som, como a rever-berao e a concentrao de harmnicos agudos, dentre as quais est a energia da onda. A manipulada com maisfacilidade a energia da onda (veja equao 2.2) e esta tambm pode variar de diferentes formas. Uma formamais simples variar a amplitude atravs da multiplicao da sequncia toda por um nmero real. O aumento deenergia sem variao de amplitude a compresso sonora, til na produo musical atual.(34)

  • 68

    Ti = TiAi = {ti.ai}10 =

    {ti.(a1)

    (i

    1)}1

    0(2.40)

    Pode-se tomar a0 = 1 para iniciar a nova sequncia com a amplitude original e ento ir modifi-

    cando com o decorrer das amostras. Esta restrio faz com que o termo a1 seja a variao da

    amplitude. Caso = 1, a variao de amplitude segue exatamente a progresso geomtrica que

    caracteriza a percepo linear. A figura 2.14 exibe as transies para diferentes valores de e

    para a transio entre os valores 1 e 2, um ganho de 6dB segundo a equao 2.4.

    Algum cuidado necessrio para lidar com a = 0. Na equao 2.39, se a0 = 0 h diviso por

    zero e se a1 = 0, h uma multiplicao por zero. Ambos os casos tornam o procedimento

    intil pois nenhum nmero diferente de zero pode ser representado como uma proporo com

    relao ao zero. Pode-se resolver isso escolhendo um nmero suficientemente pequeno como

    80dB a = 108020 = 104 como o volume mnimo no caso de um fade in (a0 = 104) ou deum fade out (a1 = 104).

    Para uma amplificao linear, mas no linear para a percepo, basta usar uma sequncia {ai}adequada:

    ai = a0 + (a1a0) i1 (2.41)

    Aqui convm a converso de decibels para amplitude. Assim, as equaes 2.8 e 2.40 especifi-

    cam a transio de VdB decibels:

    Ti =

    {ti10

    VdB20

    (i

    1)}1

    0(2.42)

    para o caso geral de variaes de amplitude segundo a progresso geomtrica. Quanto maior o

    valor de , mais suave a introduo do som e mais intenso o final da transio. > 1 resulta

  • 69

    em transies de volume muitas vezes chamadas de slow fade enquanto < 1 resulta em fast

    fade.(34)

    As transies lineares sero usadas para as snteses AM e FM e a aplicao das transies

    logartmicas para os tremolos e vibratos. Uma explorao no oscilatria destas variaes est

    na montagem musical Transita para metro, cujo cdigo est no Apndice B.2.1 e online na

    massa.(2)

    2.2.3 Aplicao de filtros digitais

    Esta subseo limita-se a uma descrio do processamento das sequncias, por convoluo

    e equao a diferenas, e em aplicaes imediatas, pois a complexidade facilmente foge ao

    escopo16. A aplicao de filtros pode ser parte constituinte da sntese ou feita posteriormente

    como parte dos processos tipicamente chamados de tratamento sonoro.

    Convoluo e filtros de resposta ao impulso finita (FIR)

    Os filtros aplicados por convoluo so conhecidos pela sua sigla FIR (do ingls Finite

    Impulse Response) e so caracterizados por possurem uma representao amostral finita

    no tempo. Esta representao amostral chamada de resposta ao impulso {hi}. Os filtrosFIR so aplicados no domnio temporal ao som digitalizado pela convoluo do som com

    a resposta ao impulso do filtro17. Para os fins deste trabalho, a convoluo fica definida

    como:

    16 A elaborao de filtros constitui uma rea reconhecidamente complexa, com literatura e pacotes de softwarededicados. Recomendamos ao leitor interessado uma visita nossa bibliografia.(25, 35)

    17 Pode-se aplicar o filtro do domnio espectral atravs da multiplicao das transformadas de Fourier de ambos osom e a resposta ao impulso, e ento realizada a transformada inversa de Fourier do espectro resultante.(25)

  • 70

    Figura 2.15 Interpretao grfica da convoluo. Cada amostra resultante a soma das amostrasanteriores de um sinal uma a uma multiplicadas pelas amostras retrgradas do outrosinal.

    {ti}t+h2 = t 10

    = {(T j H j)i}t 10 =

    min(h1,i)j=0

    h j.ti j

    t 1

    0

    =

    i

    j=max(i+1h,0)t j.hi j

    t 1

    0

    (2.43)

    Onde ti = 0 para as amostras no definidas de antemo. Ou seja, o som {ti } resultante daconvoluo de {ti} com a resposta ao impulso {hi} tem cada i-sima amostra ti substitudapela soma de suas ltimas h amostras {ti j}h1j=0 multiplicadas uma a uma pelas amostrasda resposta ao impulso {hi}h10 . Este procedimento est ilustrado na figura 2.15, onde aresposta ao impulso {hi} percorrida na forma retrgrada e t12 e t32 so duas amostrascalculadas pela convoluo (T j H j)i = ti . O sinal resultante possui sempre o tamanhot +h1 = t .

    Com este procedimento pode-se aplicar reverberadores, equalizadores, delays e vrios

  • 71

    outros tipos de filtros para fins de tratamento sonoro ou efeitos musicais/artsticos.

    A resposta ao impulso pode provir de medies fsicas ou da sntese. Uma resposta

    ao impulso para a aplicao de reverberao pode resultar da gravao sonora em um

    ambiente ao disparar um estalo que se assemelhe a um impulso ou de uma varredura em

    senoide, que transformada se aproxima da resposta em frequncia. Ambas so respostas

    ao impulso que, convoluidas com a sequncia sonora, resultam na prpria sequncia com

    uma reverberao que se assemelha quela do ambiente em que ocorreu a medio.(10)

    A transformada inversa de Fourier de uma envoltria par e real uma resposta ao im-

    pulso de um FIR. Este realiza uma filtragem em frequncia com a envoltria. Quanto

    maior o nmero de amostras maior a resoluo da envoltria e tambm o processamento

    computacional, pois a convoluo cara.

    Uma propriedade importante o deslocamento temporal causado pela convoluo com

    o impulso deslocado. Embora caro computacionalmente, pode-se criar linhas de delays

    atravs da convoluo do som com uma resposta ao impulso que possui um impulso

    para cada reincidncia do som. Na figura 2.16 pode-se observar o deslocamento causado

    pela convoluo com o impulso. Dependendo da densidade dos impulsos, o resultado

    de carter rtmico (20 impulsos por segundo ou menos) ou de amlgama sonoro (20-

    40 impulsos por segundo ou mais). Neste ltimo caso, ocorrem processos tipicamente

    vinculados sntese granular, delays, reverbs e equalizaes.

    Filtros de resposta ao impulso infinita (IIR)

    Esta classe de filtros conhecida pela sigla IIR (do ingls Infinite Impulse Response) e

    caracterizada por possuir uma representao temporal infinita, i.e. a resposta ao impulso

    no converge para zero. Sua aplicao usualmente feita pela equao:

  • 72

    Figura 2.16 Convoluo com o impulso: deslocamento (a), linhas de delays (b) e sntese granular (c).Dispostos em ordem crescente de densidade de pulsos.

    ti =1b0

    Jj=0

    a j.ti j +K

    k=1

    bk.tik

    (2.44)com b0 = 1 na grande maioria dos casos pois pode-se normalizar as variveis: aj =

    a jb0

    e

    bk =bkb0 b0 = 1. A equao 2.44 chamada equao a diferenas por exibir as amos-

    tras resultantes{ti}

    atravs das diferenas entre as amostras originais {ti} e as amostrasresultantes anteriores

    {tik

    }.

    Existem diversos mtodos e ferramentas para a elaborao de filtros IIR e segue abaixo

    uma seleo com fins didticos e para consulta futura por utilidade. So filtros bem

    comportados e cujas filtragens esto na figura 2.17.

    No caso dos filtros de ordem simples, a frequncia de corte fc onde o filtro realiza uma

    atenuao de 3dB 0.707 da amplitude original. No caso dos filtros passa e rejeitabanda, esta mesma atenuao resultado de duas especificaes: fc (neste caso mais bem

    compreendida como frequncia central) e a largura de banda bw, em ambas as frequn-

  • 73

    cias fc bw h uma atenuao de 0.707 da amplitude original. Existe amplificaodo som no caso dos filtros passa e rejeita banda quando a frequncia de corte baixa e

    a largura de banda grande o suficiente. Nos agudos, estes filtros apresentam somente

    um desvio do perfil esperado, expandindo a envoltria para o lado grave da banda em

    evidncia.

    Para filtros cujas respostas em frequncia possuem outras envoltrias (para o mdulo),

    pode-se realizar cascatas destes filtros aplicando-os sucessivamente. Outra possibilidade

    utilizar alguma receita de filtro biquad18 ou rotinas para clculo de coeficientes de filtros

    Chebichev19. Ambas as possibilidades so exploradas por ttulos em nossas referncias,

    em especial (35, 36) e a coleo de filtros da comunidade Music-DSP, da Universidade

    de Columbia.(25, 37)

    1. Passa-baixas de polo simples com mdulo da resposta em frequncia no canto superior

    esquerdo da figura 2.17. A frmula geral tem por referncia da frequncia de corte fc (0, 12 ), frao da frequncia de amostragem fa em que h aproximadamente uma atenuao

    de 3dB. Os coeficientes do filtro IIR a0 e b1 so dados atravs da varivel intermediria

    x [epi,1]:

    x = e2pi fc

    a0 = 1 x

    b1 = x

    (2.45)

    2. Passa-altas de polo simples com o mdulo da resposta em frequncia no canto superior

    direito da figura 2.17. A frmula geral, com frequncia de corte fc (0, 12 ), calculada18 Abreviao de biquadrado pois sua funo de transferncia possui dois polos e dois zeros, i.e. sua forma normal

    consiste em dois polinmios quadrticos formando uma frao: H(z) = a0+a1.z1+a2.x2

    1b1.z1b2.z2 .19 Filtros Butterworth e Elpticos podem ser considerados como casos especficos dos Filtros do tipo Chebichev.(25,

    35)

  • 74

    Figura 2.17 Mdulos da resposta em frequncia (a), (b), (c) e (d) respectivamente dos filtros IIR dasequaes 2.45, 2.46, 2.48 e 2.49 para diferentes frequncias de corte, frequncias centraise larguras de banda.

    atravs da varivel intermediria x [epi,1]:

    x = e2pi fc

    a0 =x + 1

    2

    a1 = x + 12b1 = x

    (2.46)

    3. N (notch filter). Este filtro parametrizado pela frequncia central20 fc e a largura de

    banda bw - fcbw, que resultam em 0.707 da amplitude, i.e. atenuao de 3dB - ambosdados como fraes de fa, portanto f , bw (0,0.5).

    Por facilidade, sejam as variveis auxiliares K e R:

    20 Ateno com a frequncia de corte tambm fc nos filtros passa baixas e passa altas.

  • 75

    R = 13bw

    K =12Rcos(2pi fc) + R2

    22cos(2pi fc)(2.47)

    O filtro passa banda do canto inferior esquerdo da figura 2.17 possui os seguintes coefici-

    entes para a equao 2.44:

    a0 = 1K

    a1 = 2(K R)cos(2pi fc)

    a2 = R2K

    b1 = 2Rcos(2pi fc)

    b2 = R2

    (2.48)

    Os coeficientes do filtro rejeita banda so: