“…In der Sprechernormalisierung werden Abbildungen von Merkmalsvektoren durch lineare Regressionsmethoden oder auch durch neuronale Netze (Fukuzawa et al, 1991) versucht, es herrschen aber eindeutig Methoden vor, die derzeit im weitesten Sinne als Vokaltraktnormalisierung (VTN) bezeichnet werden. Damit ist nicht etwa die Normalisierung auf der Basis von Vokaltraktparametern gemeint (Freienstein, 2000;Naito et al, 1999), sondern im wesentlichen eine zumeist nichtlineare Transformation der Frequenzachsen der Spektrogramme, die den Merkmalsvektoren zugrundeliegen, auf die eines Zielsprechers.…”