Compressão de Voz
A compressão de voz descreve o processo de digitalizar a fala em uma taxa de transmissão inferior a 64Kbps. É normal, entretanto, começar com uma taxa de 64Kbps da codificação PCM e comprimi-la para uma taxa inferior. A compressão de voz é possível por causa da quantidade de dados redundantes que a codificação PCM carrega. Além disto, é possível tratar as pausas de conversação para suprimir dados igualmente redundantes. Por outro lado, é necessário apensar dados e controles que, entre outras coisas, permitem suprimir o eco. A combinação de algorítimos, controles e técnicas de compressão determinam um maior ou menor consumo do processador referente àquele Codec (o compressor utilizado), bem como efeitos colaterais, mas conhecidos como distorção da voz. A eficiência da compressão estará muitas vezes ligada ao volume de tráfego concorrente naquele circuito, no caso em que há compartilhamento com o link de dados, e o meio empregado para a transmissão. Fatores como delays, congestionamento e QoS poderão ter grande influência sobre a qualidade de voz e, dependendo da codificação empregada, a sensibilidade poderá ser maior ou menor a estes fatores.
Em geral as compressões mais agressivas requerem premissas acerca da qualidade do link, controle de banda e congestionamento mais otimistas, estando muito mais sujeitas a distorções em função das condições do link. Apenas para fins de ilustração, evidentemente, um link em laboratório, dedicado apenas à transmissão de voz, bem comportado e sem influência do meio externo permitirá exibir uma excelente ligação com 6kbps de uso de banda, ou até menos, sem problemas de eco ou distorção.
Evidentemente, estamos falando de um laboratório, em condições que jamais serão encontradas no mundo real. Em termos acadêmicos discutem-se níveis de compressão ainda menores, sem distorção excessiva, porém com qualidade assegurada apenas em ambiente de laboratório altamente controlado, sem qualquer fonte de ruído ou interferência presente, requerendo um grande processamento e técnica de inteligência artificial, tratando-se de limites teóricos, neste momento, portanto. Atualmente, a compressão mais usual e utilizada no Brasil é aquela proporcionada pelo Codec G.729, e que resulta em um consumo de banda ao redor de 30kbps, nas melhores condições.
A seguir apresentamos um quadro típico de menu de um PBX IP, com relação à escolha dos Codecs:
| G.723 (MP-MLQ speech coding at 6,3(5,3) kbit/s rate) |
| G.726-16 (ADPCM speech coding at 16 kbit/s rate) |
| G.726-32 (ADPCM speech coding at 32 kbit/s rate) |
| G.726-24 (ADPCM speech coding at 24 kbit/s rate) |
| G.729a (CS-ACELP speech coding at 8 kbit/s rate) (preferred) |
| G.711a (PCM audio coding standard, 8 kHz sample rate, 8 bits, 64 kbit/s data rate) |
| G.711u (PCM audio coding standard, 8 kHz sample rate, 8 bits, 64 kbit/s data rate) |
|