2004
DOI: 10.1109/lsp.2004.826648
|View full text |Cite
|
Sign up to set email alerts
|

Cepstral Domain Segmental Nonlinear Feature Transformations for Robust Speech Recognition

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
1
1

Citation Types

1
29
0
3

Year Published

2005
2005
2015
2015

Publication Types

Select...
3
3
1

Relationship

0
7

Authors

Journals

citations
Cited by 48 publications
(33 citation statements)
references
References 7 publications
1
29
0
3
Order By: Relevance
“…When the amount of sample data is small, the order statistic-based CDF estimation method can be more reliable than the classical histogram-based approach due to its enhanced probabilistic resolution. A brief algorithm of the order statistics-based CDF estimation is given as follows [13].…”
Section: Order Statistic-based Cdf Estimationmentioning
confidence: 99%
See 1 more Smart Citation
“…When the amount of sample data is small, the order statistic-based CDF estimation method can be more reliable than the classical histogram-based approach due to its enhanced probabilistic resolution. A brief algorithm of the order statistics-based CDF estimation is given as follows [13].…”
Section: Order Statistic-based Cdf Estimationmentioning
confidence: 99%
“…HEQ is basically a nonlinear transformationbased approach. In this sense, it can fundamentally cope with the nonlinearity of noisy features in the case of logarithmic space-based features such as cepstral features and is reported to provide considerable performance improvements in both speech recognition and speaker recognition in noisy environments [11][12][13][14][15][16][17]. In addition, HEQ is computationally efficient because most of its algorithm consists of sort and search routines with relatively narrow depth and scope.…”
Section: Introductionmentioning
confidence: 99%
“…Segundo [146] a função densidade de probabilidade do sinal de voz tem uma forma de onda similar a uma Gaussiana, além de que grande parte dos sistemas de reconhecimento as distribuições de saída dos HMMs são modeladas como mistura de Gaussianas. Já em [147] foi proposta uma função de distribuição empírica estimada a partir dos histogramas acumulativos dos dados de treinamento. Dessa forma a função de distribuição de referência terá uma forma muito semelhante a uma mistura gaussiana, cujos valores de média e variância têm a ver com características próprias do banco de dados e do processo de treinamento.…”
Section: Capítulo 2 Estado Da Arte Em Reconhecimento De Voz Contínuaunclassified
“…Os autores propõem que a equalização dos coeficientes C 0 e C 1 seja responsável pelo maior incremento nas taxas de acerto, aumentando o número de coeficientes quando existe ruído de canal adicionado ao ruído aditivo. Uma melhoria adicional do HEQ foi proposta em [150], onde os parâmetros são estimados para normalizar os histogramas dos atributos e maximizar a probabilidade dos atributos normalizados avaliados no modelo acústico. Recentemente em [151] foi proposta uma mistura de uma filtragem temporal de média com a normalização baseada em HEQ chamada filteredbased histogram equalization (FHEQ) com o objetivo suavizar a sequência de funções de distribuição de probabilidades antes do mapeamento.…”
Section: Capítulo 2 Estado Da Arte Em Reconhecimento De Voz Contínuaunclassified
See 1 more Smart Citation