Interspeech 2020 2020
DOI: 10.21437/interspeech.2020-2258
|View full text |Cite
|
Sign up to set email alerts
|

Phase Based Spectro-Temporal Features for Building a Robust ASR System

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
3
2

Citation Types

0
1
0
8

Year Published

2021
2021
2023
2023

Publication Types

Select...
2
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(9 citation statements)
references
References 11 publications
0
1
0
8
Order By: Relevance
“…No contexto geral de sistemas de ASR, atributos de tempofrequência (espectrogramas) provenientes dos espectros de magnitude |X n (e jω )|, obtidos da STFT 1 do sinal de fala x(n), têm apresentado resultados satisfatórios em aplicações de ASR operando em ambientes acústicos com alta SNR [6], [10]. Nesses ambientes, os espectrogramas de magnitude são capazes de capturar as características harmônicas e de transição entre diferentes unidades fonéticas (fonemas) [10].…”
Section: A Espectrogramas Do Sinal De Falaunclassified
See 4 more Smart Citations
“…No contexto geral de sistemas de ASR, atributos de tempofrequência (espectrogramas) provenientes dos espectros de magnitude |X n (e jω )|, obtidos da STFT 1 do sinal de fala x(n), têm apresentado resultados satisfatórios em aplicações de ASR operando em ambientes acústicos com alta SNR [6], [10]. Nesses ambientes, os espectrogramas de magnitude são capazes de capturar as características harmônicas e de transição entre diferentes unidades fonéticas (fonemas) [10].…”
Section: A Espectrogramas Do Sinal De Falaunclassified
“…No contexto geral de sistemas de ASR, atributos de tempofrequência (espectrogramas) provenientes dos espectros de magnitude |X n (e jω )|, obtidos da STFT 1 do sinal de fala x(n), têm apresentado resultados satisfatórios em aplicações de ASR operando em ambientes acústicos com alta SNR [6], [10]. Nesses ambientes, os espectrogramas de magnitude são capazes de capturar as características harmônicas e de transição entre diferentes unidades fonéticas (fonemas) [10]. A fim de preservar essas características acústicas, em esse problema, [5], [10] e [11] usam uma versão modificada da função atraso de grupoτ n (e jω ) (modified group delay -MOGD) para representar o espectro de fase da STFT, a qual pode ser definida como uma aproximação da derivada do espectro de fase 2 θ n [X n (e jω )] e expressa por τ n (e jω ) = Y I (e jω )X I (e jω ) + Y R (e jω )X R (e jω ) |X n (e jω )| 2γ .…”
Section: A Espectrogramas Do Sinal De Falaunclassified
See 3 more Smart Citations