Interspeech 2019 2019
DOI: 10.21437/interspeech.2019-1327
|View full text |Cite
|
Sign up to set email alerts
|

Harmonic-Aligned Frame Mask Based on Non-Stationary Gabor Transform with Application to Content-Dependent Speaker Comparison

Abstract: We propose harmonic-aligned frame mask for speech signals using non-stationary Gabor transform (NSGT). A frame mask operates on the transfer coefficients of a signal and consequently converts the signal into a counterpart signal. It depicts the difference between the two signals. In preceding studies, frame masks based on regular Gabor transform were applied to single-note instrumental sound analysis. This study extends the frame mask approach to speech signals. For voiced speech, the fundamental frequency is … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Year Published

2021
2021
2021
2021

Publication Types

Select...
1
1

Relationship

2
0

Authors

Journals

citations
Cited by 2 publications
(1 citation statement)
references
References 22 publications
(49 reference statements)
0
0
0
1
Order By: Relevance
“…[15], welche dann in der Akustik eingesetzt werden, etwa für die Signaltrennung [27]. Rahmen-Multiplikatoren treten daher nicht nur als mathematische Objekte auf [6,25], es werden auch deren Anwendungen studiert, wie zum Beispiel für die Entfernung von perzeptiv irrelevanten Zeit-Frequenz-Punkten [5], oder auch als Möglichkeit, die Ähnlichkeit von Instrumenten [17] oder Sprechern [14] zu beurteilen. Ein einfaches Beispiel, das etwa in der computergestützten auditorischen Szenenanalyse (CASA [28]) aber auch für das Beispiel in Abschn.…”
Section: Rahmenunclassified
“…[15], welche dann in der Akustik eingesetzt werden, etwa für die Signaltrennung [27]. Rahmen-Multiplikatoren treten daher nicht nur als mathematische Objekte auf [6,25], es werden auch deren Anwendungen studiert, wie zum Beispiel für die Entfernung von perzeptiv irrelevanten Zeit-Frequenz-Punkten [5], oder auch als Möglichkeit, die Ähnlichkeit von Instrumenten [17] oder Sprechern [14] zu beurteilen. Ein einfaches Beispiel, das etwa in der computergestützten auditorischen Szenenanalyse (CASA [28]) aber auch für das Beispiel in Abschn.…”
Section: Rahmenunclassified