This work presents a unified framework for defining a family of noise reduction techniques for speech enhancement applications. The proposed approach provides a unique theoretical foundation for some widely-applied soft and hard time-frequency masks, which encompasses the well-known Wiener filter and the heuristically-designed Binary mask. These techniques can now be considered as optimal solutions of the same minimization problem. The proposed cost function is defined by two design parameters that not only establish a desired trade-off between noise reduction and speech distortion, but also provide an insightful relationship with the mask morphology. Such characteristic may be useful for applications that require online adaptation of the suppression function according to variations of the acoustic scenario. Simulation examples indicate that the derived conformable suppression mask has approximately the same quality and intelligibility performance capability of the classical heuristically-defined parametric Wiener filter. The proposed approach may be of special interest for real-time embedded speech enhancement applications such as hearing aids and cochlear implants.
Resumo-Esse trabalho apresenta uma nova técnica de redução de ruído para implantes cocleares, baseada na estimação da envoltória temporal da fala. Simulações numéricas utilizando um critério objetivo de inteligibilidade, corroboradas por um experimento psicoacústico com um usuário de implante coclear, indicam um aumento consistente na inteligibilidade da fala em relação a sinais contaminados por ruído aditivo, como também a sinais processados pelo filtro de Wiener. Essas observações são válidas para razões sinal-ruído (SNR) menores que 10 dB e os ganhos de inteligibilidade são maiores à medida que a SNR decresce. Palavras-Chave-Redução de ruído, Implantes cocleares, Filtragem no domínio do tempo, Filtro de Wiener.
Resumo-Recentemente, um novo método de redução de ruído, denominado C2F, foi desenvolvido especificamente para implantes cocleares (IC). Esse método resulta em maior inteligibilidade da fala em usuários de IC, em comparação com o filtro de Wiener (WF), quando os coeficientes são calculados de forma ideal. Em aplicações reais, os coeficientes são obtidos a partir de estimativas da razão sinal-ruído (SNR) e, portanto, acarretam perda do desempenho ótimo. Neste trabalho é realizada uma análise preliminar da robustez do método C2F a erros de estimação da SNR. Simulações numéricas corroboram a análise teórica mostrando que, apesar de apresentar diminuição de desempenho na redução de ruído, o C2F é menos sensível que o WF a erros de estimação da SNR.
Resumo-Técnicas de filtragem no domínio tempo-frequência têm sido utilizadas com relativo sucesso para a redução de ruído em implantes cocleares. Entre as estratégias mais investigadas destacam-se a máscara Binária e o filtro de Wiener, que, entretanto, apresentam limitada capacidade de conformação. Para superar esse problema, alternativas como o filtro paramétrico de Wiener e variações foram propostas. Este trabalho apresenta uma comparação de desempenho entre quatro máscaras tempo-frequência em termos de inteligibilidade e qualidade da fala. Simulações numéricas foram realizadas e critérios objetivos correlacionados à percepção psicoacústica de usuários de implantes cocleares foram analisados. Os resultados indicam que as máscaras paramétricas são mais adequadas para esse tipo de aplicação, apesar de ainda não existirem estratégias bem definidas para a determinação de seus parâmetros.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.