Neural Networks for Signal Processing Proceedings of the 1991 IEEE Workshop
DOI: 10.1109/nnsp.1991.239497
|View full text |Cite
|
Sign up to set email alerts
|

Segment-based speaker adaptation by neural network

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2

Citation Types

0
0
0
2

Publication Types

Select...
4

Relationship

0
4

Authors

Journals

citations
Cited by 4 publications
(2 citation statements)
references
References 4 publications
0
0
0
2
Order By: Relevance
“…In der Sprechernormalisierung werden Abbildungen von Merkmalsvektoren durch lineare Regressionsmethoden oder auch durch neuronale Netze (Fukuzawa et al, 1991) versucht, es herrschen aber eindeutig Methoden vor, die derzeit im weitesten Sinne als Vokaltraktnormalisierung (VTN) bezeichnet werden. Damit ist nicht etwa die Normalisierung auf der Basis von Vokaltraktparametern gemeint (Freienstein, 2000;Naito et al, 1999), sondern im wesentlichen eine zumeist nichtlineare Transformation der Frequenzachsen der Spektrogramme, die den Merkmalsvektoren zugrundeliegen, auf die eines Zielsprechers.…”
Section: Sprechernormalisierungunclassified
See 1 more Smart Citation
“…In der Sprechernormalisierung werden Abbildungen von Merkmalsvektoren durch lineare Regressionsmethoden oder auch durch neuronale Netze (Fukuzawa et al, 1991) versucht, es herrschen aber eindeutig Methoden vor, die derzeit im weitesten Sinne als Vokaltraktnormalisierung (VTN) bezeichnet werden. Damit ist nicht etwa die Normalisierung auf der Basis von Vokaltraktparametern gemeint (Freienstein, 2000;Naito et al, 1999), sondern im wesentlichen eine zumeist nichtlineare Transformation der Frequenzachsen der Spektrogramme, die den Merkmalsvektoren zugrundeliegen, auf die eines Zielsprechers.…”
Section: Sprechernormalisierungunclassified
“…Verbreitet sind Algorithmen, die eine stetige, zumeist nichtlineare Abbildung zwischen den Signalen eines Testsprechers und denen des Referenzsprechers konstruieren. Häufig werden hierfür Perzeptrone 5 in diversen Modifikationen eingesetzt (Fukuzawa et al, 1991;Huang et al, 1991). Ebenfalls angewendet wird die Vektorquantisierung (VQ) der Sprachsignale.…”
Section: Ansätze Zur Sprechernormalisierungunclassified