A Escola | Cursos | Professores | Artigos | Links
 


SOM ANALÓGICO E SOM DIGITAL


Sérgio Izecksohn

Para gravarmos os sons numa fita ou no HD, temos que convertê-los primeiro em sinais elétricos e depois em informações digitais. E para usarmos bem toda essa tecnologia cada dia mais disponível, um pouquinho de teoria ajuda. Engorda e faz crescer o nosso som.

Ondas sonoras.
Primeiro, recordemos alguns princípios da física do som. Tudo o que chamamos de som são vibrações dos meios físicos, como o ar. Uma corda de violão ou nossas cordas vocais movimentam-se e pressionam o ar em vaivém. Uma vibração ou um ciclo ocorre quando o ar é comprimido e rarefeito, voltando depois ao estado original. Quando estas vibrações ocorrem entre 20 e 20 mil vezes por segundo ouvimos um ou mais sons. O físico Hertz deu seu nome à medida ‘ciclos por segundo’. Ouvimos então, do grave pro agudo, vibrações nas freqüências de 20 Hz até 20 kHz, aproximadamente.

O gráfico com o desenho de ondas sonoras ou oscilograma, presente em muitos programas de gravação, mostra a compressão e a descompressão do ar ao longo do tempo. Na vertical, a variação na pressão do ar determina os volumes do som. Na horizontal, o tempo decorrido.




Som analógico.
Um microfone tem uma membrana que acompanha as vibrações do ar e um circuito que gera uma corrente elétrica. A tensão ou voltagem dessa corrente varia, oscilando junto com as vibrações da membrana. Uma boa comparação com a variação da voltagem é o movimento de abrir e fechar suave e sucessivamente uma torneira. Ou, se você usar um dimmer para clarear ou escurecer um ambiente, você, ao girar o botão, estará deixando passar mais ou menos corrente para a lâmpada. Estará fazendo oscilar a voltagem ou tensão elétrica que chega à lâmpada, fazendo-a iluminar mais forte ou mais fraco o ambiente.

É isso o que o microfone faz. Todas as vibrações sonoras que ele consegue captar do ar com sua membrana são transformadas em oscilações na voltagem da corrente que ele manda pelo cabo até o amplificador. De lá até o alto-falante, trabalhamos com variações de tensão elétrica. Quando o sinal elétrico do áudio chega ao alto-falante, este faz o movimento inverso ao do microfone: seu cone vibra acionado pelas variações elétricas e, assim, põe o ar em movimento, produzindo novamente som mecânico.

Entre a membrana do microfone e o cone do alto-falante temos o sinal elétrico do áudio, ou o som analógico. Analógico e não análogo, que quer dizer parecido. Analógico por se basear numa analogia, ou semelhança, no caso entre as vibrações do ar e as oscilações da voltagem.

Som digital.
Quando mandamos o som analógico para uma placa de som de computador ou para uma mesa digital, o sinal elétrico terá que ser digitalizado, ou convertido em informações expressas em números. Na entrada do aparelho onde plugamos o cabo há um conversor analógico/digital, ou AD. Na saída do aparelho, existe um respectivo conversor DA, digital/analógico. O AD precisa transformar voltagens em números. O DA faz o contrário, recriando o som analógico depois dele ter sido processado pelo computador para que o alto-falante possa nos mostrar o resultado.


O conversor AD colhe amostras periódicas da pressão sonora

O conversor AD transforma as vibrações sonoras em números por um processo de amostragem. Milhares de vezes por segundo, ele “anota” o estágio da oscilação e lhe atribui um valor numérico. São, na verdade, milhões de números anotados numa pequena canção. Ao ser representada graficamente, essa lista de números adquire uma forma de onda semelhante ao gráfico do som original. Porém, se olharmos de perto, veremos que as curvas da oscilação parecem uma escadinha, a onda faz um ziguezague. De fato, o som digital não é contínuo, ele é como um pisca-pisca muitíssimo rápido. Quanto mais vezes por segundo são colhidas as amostras da oscilação do som, mais o som digital se assemelha ao som original.


Aspecto da onda sonora depois de digitalizada

Taxas de amostragem.
A colheita de amostras também é medida em Hertz. Examinemos o que aconteceria com três diferentes sons digitalizados em 10 mil amostras por segundo. Dizemos que essa taxa de amostragem é de 10 kHz. Um som grave de 100 Hz, um som médio de 1 kHz e um agudo de 10 kHz. Cada ciclo da onda sonora de 100 Hz terá cem amostras, já que são 10 mil amostras para 100 ciclos. Com 100 amostras, este ciclo será razoavelmente bem representado por uma “escadinha” quase curva. Cada ciclo da onda de 1 kHz terá apenas dez amostras, o que não chega a definir tão bem o seu desenho ao longo do tempo. Mas repare que cada ciclo de onda do som de 10 kHz terá apenas uma amostra, já que são dez mil ciclos de onda e dez mil amostras em um segundo. Se temos apenas uma amostra por ciclo, elas não permitem visualizar (nem ouvir) uma oscilação. Quando o conversor DA for ligar essas amostras para que o alto-falante nos mostre o som, teremos ausência de oscilação, o que significa silêncio: aquela freqüência não será ouvida. No desenho das ondas sonoras ao longo do tempo, uma linha horizontal equivale a uma corda de violão parada, sem produzir som.


Uma onda complexa tem freqüências perdidas numa baixa taxa de amostragem

Para permitir a audição de uma oscilação numa certa freqüência, a amostragem deve ser de, no mínimo, o dobro daquela freqüência, o que, pelo menos, já caracteriza uma oscilação: uma amostra para algum ponto do “morro” e outra para um ponto do “vale” que formam o ciclo. Assim, se ouvimos freqüências até 20 kHz, a indústria, ao criar o CD, teve que adotar uma taxa de amostragem superior a 40 kHz. Escolheu 44.1 kHz, ou 44 mil e cem amostras por segundo, que deve ser a única amostragem utilizada na confecção de um CD de áudio. Já a indústria da multimídia sonoriza programas em CD-ROM com amostragens mais baixas, como 22.05 kHz, para desobstruir o tráfego de informações entre o leitor de CD-ROM e a memória do computador. O resultado é um som abafado, quase sem agudos, já que em 22.05 kHz só ouvimos freqüências até 11.025 Hz. Procure os pratos da bateria na música do seu jogo preferido em CD-ROM. Por outro lado, o DVD-Video usa 96 kHz e o DVD-Audio vai a 192 kHz. O resultado são agudos mais precisos.

Você não consegue melhorar o som aumentando a taxa de amostragem após ele ter sido digitalizado. Mas consegue piorá-lo se diminuir.

Bits.
Cada amostra digital é um ponto que marca a posição da oscilação sonora num certo instante. De tanto em tanto tempo (por exemplo, num CD, a cada 1/44100 de segundo ou 0,000023 seg) o conversor AD marca se a voltagem subiu ou desceu. Indica com um valor numérico uma variação na amplitude da onda, uma variação no sentido vertical do desenho. Quantos valores podemos usar para expressar essa variação na amplitude da onda? Depende do conversor AD e do programa utilizado. Ele pode usar uma quantidade maior ou menor de valores, o que vai interferir na dinâmica, na variação dos volumes dos sons.

A quantidade de valores possíveis para indicar a amplitude em cada amostra da onda é expressa em ‘bits’. Isto porque o computador, para fazer seus cálculos, usa o sistema binário. Como temos dez dedos, geralmente usamos o sistema decimal, com dez algarismos, para fazermos contas. Com um dígito formamos dez números: 0, 1, 2, 3, 4, 5, 6, 7, 8 e 9. Com dois dígitos, cem números, 00 a 99; três dígitos, mil números e a cada dígito multiplicamos o total de valores por dez.

No computador, um bit é um instante em que ele verifica a presença ou ausência de eletricidade e ele representa as duas opções com os dígitos zero e um. Como só dispõe de dois algarismos, 0 e 1, em um bit, o computador forma o número zero ou o número 1. Mas em dois bits, forma quatros números, 00, 01, 10 e 11, que correspondem a 0, 1, 2 e 3. Com três bits, 000, 001, 010, 011, 100, 101, 110 e 111, temos oito números, de 0 a 7. Em quatro bits, de 0000 a 1111, formamos números de 0 a 15. Cada bit a mais dobra a quantidade de valores possíveis.

Já que 8 bits permitem formarmos 256 números, o som digitalizado em 8 bits só tem 256 volumes possíveis ao longo do tempo. E a dinâmica do ouvido humana é muito mais sofisticada, conseguindo distinguir desde o bater das asas do mosquito até uma turbina de avião, som milhões de vezes mais forte.

Em 16 bits, que é o formato usado nos CDs de áudio, temos 65536 volumes possíveis, o que já é um salto qualitativo. Os 24 bits usados no DVD permitem 16.777.216 variações na amplitude. Podemos trabalhar com arquivos maiores, como 20 ou 24 bits e depois converter para 16 ou menos bits, já que esses valores são múltiplos uns de outros.

Cabos digitais. Entre dois dispositivos digitais, como uma mesa e um gravador ou placa de som, o som pode transitar já digitalizado, economizando conversões desnecessárias no meio do caminho. Para isso, são usados diversos cabos, conectores e formatos. Os mais comuns são o AES/EBU, estéreo profissional com plug XLR; S/PDIF, estéreo doméstico em cabo RCA ou ótico; ADAT, com oito canais em um cabo ótico e TDIF, também de oito canais num cabo multipinos.


Sérgio Izecksohn (sergio@homestudio.com.br) é músico, produtor e professor dos cursos do Home Studio


Publicado na Revista Backstage em 2001