Uma das coisas com que em tese a gente tem que se preocupar quando masteriza e entrega um trabalho é o tal do valor True Peak (ou Pico Verdadeiro) . Mas o que realmente significa garantir que o valor de pico tem que ser "verdadeiro" ? Por que simplesmente o valor de pico do áudio não basta? É o que vamos ver agora.
O Valor Digital de Pico
Existem duas coisas a respeito de áudio digital que todo mundo que usa uma interface e DAW (ou seja, todo mundo mesmo) deveria saber de cor, ou quem sabe colocar numa placa de prata na parede:
- Quanto mais alto o nível do sinal, melhor a qualidade...
... mas existe um valor máximo de nível que o sinal pode ter.
Ou seja, normalmente é vantajoso que o sinal tenha volume alto, mas se esse volume atingir o máximo possível, teremos problemas.
Esse volume máximo é o chamado 0dBFS (Full Scale). Não convém agora a gente entrar a fundo no porquê desse nome. O que nos interessa no momento é saber que esse é o máximo possível. Visualmente é mais ou menos isso:
Quando exageramos no nível ("volume") , tentando ultrapassar o máximo possivel, ocorre uma clipagem na forma de onda. Considerando apenas a fidelidade ao que está gravado ou ao que se quer gravar, excesso de nível é algo a se evitar.
OBS: Para os mais curiosos, isso tudo está relacionado a quantos bits estão sendo usados para representar o sinal. Pouco nível usa menos bits do que se poderia, nível alto usa praticamente todos os bits, e excesso de nível tenta usar mais bits do que estão disponíveis.
Como Se Evitaria o Problema
Vamos agora para a situação em que estamos preparando a master de uma música e precisamos ajustar o loudness final. Como a ideia é oferecer o máximo volume possivel para que o cliente e ouvinte fiquem felizes, começamos a usar ferramentas para empurrar o volume para cima e ao mesmo tempo tentamos garantir que esse 0dBFS nunca seja ultrapassado.
A princípio seria bem simples. Bastaria colocar um limiter bem parrudo como último elemento, ajustando seu nível de saída para , por exemplo, -0,3 dB. Ou - como ultimamente está na moda - posso colocar um clipper, que também impeça o sinal de tentar ultrapassar o máximo.
Parece lógico e simples , certo? Sem dúvida, se não fossem os Intersample Peaks.
Onde Está o Problema?
Vamos interromper um pouco nossa sequência de raciocínio para chamar atenção para um fato importante.
Na figura abaixo, temos uma senoide que foi digitalizada usando uma sample rate correta. O que está armazenado no computador são os pontos marcados com "x". Quando eles forem convertidos em analógico, a onda que sairá da interface é a senoide violeta da figura. Ou seja: esses samples que estão aí recriam essa onda exatamente com essa forma:
E aí você se pergunta: "Como é que a interface sabe que se ela receber os samples a e b da figura ela tem que fazer essa curva ali que passa acima deles?".
É uma ótima pergunta, e a resposta demonstra uma das maravilhas do Teorema da Amostragem. Essa senoide que passa por todos esses samples ali da figura é a única que cabe ali e que tem a frequência certa. Quaisquer outras que passem por esses pontos vão ter frequências acima do dobro da frequência de amostragem, e estão fora. A Matemática é mesmo fascinante! Nós estamos guardando no computador samples que nesse exemplo, estão abaixo do valor máximo da onda que eles representam, e mesmo assim a conversão para analógico vai recriar a forma correta.
Aí nós pegamos essa onda ali de cima e aumentamos o volume, procurando um loudness maior. Acaba chegando uma hora em que chegamos no topo. E aí pode acontecer a situação em que entre dois samples que estão no máximo ainda haveria informação na onda a reconstruir com valores acima deles - ocorrem os chamados Intersample Peaks (Picos Entre Samples) . A partir daí começamos a ter problemas, como aqui embaixo:
Nós aqui aumentamos o nível de uma forma que os samples a e b não ultrapassam 0dBFS. Em tese estaria tudo certo, porque os samples estão dentro do limite.
O problema é que lá na conversão para analógico, a interface vai tentar criar a onda violeta e aí acaba acontecendo a saturação, porque a onda fica clipada. Ou seja, o problema acontece na parte analógica da interface, como abaixo (fonte: Mastering The Mix) :
Medida em Peak x True Peak
Nesse caso, se estivéssemos usando um medidor de Peak , não haveria indicação de problemas, porque os picos ainda estão dentro do limite de volume. O que essa medida faz é simplesmente verificar se algum sample ultrapassou o máximo, e como nesse caso não aconteceu, não há indicação de problema.
Só que na parte analógica da interface , como vimos, pode acontecer saturação não desejada. E isso não acontece só no estúdio. O problema vai aparecer bem mais intensamente nos players mais simples, e eles normalmente são onde muitos consumidores ouvem. Dependendo da qualidade da interface no estúdio, a gente pode estar entregando um áudio que para nós não tem problema nenhum mas que distorce para um bom número de ouvintes típicos.
No exemplo abaixo, o medidor sinaliza o valor máximo de cada sample, indicado na seta verde, e também o valor do True Peak (seta laranja):
Repare que embora o valor máximo de cada sample seja -0.1 dB , quando a interface for recriar a onda analógica, o valor máximo da onda será 2.1dB, o que provavelmente vai distorcer o que se ouve.
Isso preocupa as plataformas de streaming, que não querem que seus ouvintes achem o som das músicas "estranho" , e por isso recomendam um valor de segurança de -1dBTP (True Peak).
Como Medir True Peak?
Alguém poderia dizer que se a gente conseguir medir o valor que a onda vai ter entre dois samples, detecta o problema, e essa pessoa estaria certa. O que a Recomendação ITU-R BS.1770-4 ( a ITU - International Telecommunication Union é o órgão internacional que regula o setor) propõe é medir o sinal usando um oversample de 4x (para 48kHz) , pelo menos.
O que o oversample faz na prática é colher mais samples entre os samples do áudio armazenado. No caso de 4x em 48kHz, o sinal é reamostrado dentro do medidor em 192kHz.
No exemplo abaixo, vemos o que acontece com um oversampling de 2x. Fica fácil observar que os samples extra (em azul) , permitem detectar os picos acima de 0dBFS.
Resumindo
A medida em True Peak é extremamente útil para se identificar potenciais problemas lá na reprodução do áudio nos ouvintes, e ela é mais importante quanto mais empurramos volume em nossas masters.
Além disso, como as plataformas de streaming e os meios de broadcast estão preocupadas com isso e recomendam/exigem que se mantenha o valor TP em -1 dB, por exemplo, os medidores de True Peak acabam sendo fundamentais ao se preparar um material para entrega.
Felizmente existem hoje à disposição medidores de TP e processadores que se encarregam de limitar o volume para nós, bastando apenas que se selecione uma opção, como vemos abaixo.
No mínimo uma novidade (ao menos para mim) me salta aos olhos, a partir desse interessantíssimo texto: descobrir que a onda sonora, após passar por todos os processos digitais, consegue resultar numa senóide perfeita. Sempre imaginei que a onda resultante fosse no formato de uma "escadinha" que tenta simular as curvas da onda analógica... Outro aspecto que passarei a observar mais de perto é a questão do "True Peak Máximo". Como primeira providência, no meu medidor WLM Plus Stereo, alterarei esse parâmetro para ( -1,0 ), ao invés dos atuais ( - 0,3 ). Espero ter entendido corretamente os ensinamentos do seu ótimo texto! Parabéns pelo conteúdo e sigo "na escuta"! Grande abraço!