Resumo-Propõe-se uma variante do algoritmo de quantização vetorial particionada (QVP) que reduz a perda por particionamento, mantendo a baixa complexidade de busca que caracteriza a QVP. Ele atua em parte nas fases de treinamento e de codificação, quando normaliza a largura de faixa que cada subvetor ocupa. Por outra parte, na decodificação cada subvetor selecionado do dicionário de códigos tem sua largura de faixa renormalizada para cobrir ao máximo a região permitida pela restrição de ausência de sobreposição entre faixas de subvetores vizinhos. Considerando esses procedimentos, o algoritmoé denominado de QVP com renormalização (QVPR). O desempenho da QVPRé analisado em comparação com a QVP comum na codificação de vetores de frequências das raias espectrais (LSFs) que representam a envoltória espectral de curto prazo de sinais de voz de faixa larga, para os quais a QVPR economiza quatro bits por vetor, atingindo codificação transparente em 42 bit/quadro.
Palavras-Chave-Quantização vetorial particionada (QVP), frequências das raias espectrais (LSFs), análise de sinais de voz, codificação de voz.Abstract-A variant split vector quantization (SVQ) algorithm is proposed that reduces the split loss while keeping the complexity low as usual for a split algorithm. Partially, it operates in the training and encoding phases, when it adjusts the width of the frequency band spanned by each split. Complementarily, in the decoding phase each subvector selected from a split of the codebook undergoes a bandwidth renormalization in order to maximally cover the region allowed by a nonoverlapping constraint between neighboring split bands. In consideration to these procedures, the algorithm is called renormalized SVQ (RSVQ). The performance of RSVQ is analyzed in comparison to standard SVQ in coding line spectral frequency (LSF) vectors that represent the short-term spectral envelope of wideband speech, where RSVQ saves four bits per vector, reaching transparent coding at 42 bit/frame.
Keywords-Split vector quantization (SVQ), line spectral frequencies (LSFs), speech analysis, speech coding.
I. INTRODUÇÃOA quantização vetorialé mais eficiente que a quantização escalar em termos de taxa e distorção. Entretanto, sua correspondente complexidade de busca cresce exponencialmente com a dimensão do vetor para a busca exaustiva. Por sorte, há métodos subótimos de alta eficiência como a quantização vetorial particionada [1], queé comumente usada para a codificação da envoltória espectral de sinais de voz.A vantagem da QVPé particularmente grande quando a envoltória espectral de curto prazoé representada por cofinanciado pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) através do Processo no. 309249/2008-2 e pela Fundação de Amparoà Pesquisa do Estado de São Paulo (FAPESP) através do Processo no. 2009/18242-5. eficientes LSF porque, quando a perturbação atinge apenas um deles, a distorção aparece na região espectral localizada em torno do seu valor [2]. Este comportamento está de acordo com a percepção auditiva hum...