Segment-based speaker adaptation by neural network

Fukuzawa, K.; Sawai, Hirozumi; Sugiyama, M.

doi:10.1109/nnsp.1991.239497

Cited by 4 publications

(2 citation statements)

References 4 publications

Supporting

Mentioning

Contrasting

Unclassified

Order By: Relevance

“…In der Sprechernormalisierung werden Abbildungen von Merkmalsvektoren durch lineare Regressionsmethoden oder auch durch neuronale Netze (Fukuzawa et al, 1991) versucht, es herrschen aber eindeutig Methoden vor, die derzeit im weitesten Sinne als Vokaltraktnormalisierung (VTN) bezeichnet werden. Damit ist nicht etwa die Normalisierung auf der Basis von Vokaltraktparametern gemeint (Freienstein, 2000;Naito et al, 1999), sondern im wesentlichen eine zumeist nichtlineare Transformation der Frequenzachsen der Spektrogramme, die den Merkmalsvektoren zugrundeliegen, auf die eines Zielsprechers.…”

Section: Sprechernormalisierungunclassified

“…Verbreitet sind Algorithmen, die eine stetige, zumeist nichtlineare Abbildung zwischen den Signalen eines Testsprechers und denen des Referenzsprechers konstruieren. Häufig werden hierfür Perzeptrone 5 in diversen Modifikationen eingesetzt (Fukuzawa et al, 1991;Huang et al, 1991). Ebenfalls angewendet wird die Vektorquantisierung (VQ) der Sprachsignale.…”

Section: Ansätze Zur Sprechernormalisierungunclassified

See 1 more Smart Citation