Система обнаружения атак воспроизведением речи, основанная на смеси алгоритмов классификации А.А. Лепендин, Я.А. Филин, П.В. Малинин Алтайский государственный университет (Барнаул, Россия) Fast development of modern technologies of digital processing and speech recording leads to the fact that it is necessary to take into account the potential threats from the speech replay attacks. We propose our ensemble fusion replay attack detection system. It uses constant Q cepstral coefficients as speech features and short-time mean normalization for their preprocessing. The set of binary classifiers includes multiple Gaussian mixture models based Bayesian classifier, i-vector based Gaussian Probabilistic Linear Discriminant Analysis and XGBoost tree boosting algorithm. Fusion of scores was made by modified logistic regression algorithm from BOSARIS toolbox. ASV Spoof 2017 corpus is utilized in the experiments as the main database for anti-spoofing systems evaluation. Obtained results demonstrate that the proposed system can provide substantially better performance than the baseline Gaussian mixture model classifier. The pre-processing of cepstral features is crucial for the better performance of the system. High evaluation performance can be obtained using only few algorithms in a set. The attained value of equal error rate EER=12.44% for our fusion classifier is competitive with the best results obtained during last two years.Keywords: automatic speaker verification; voice spoofing; replay attacks; universal background model; i-vector; probabilistic linear discriminant analysis; tree boosting; model fusion.Быстрое развитие современных технологий циф-ровой обработки и записи речевых сигналов приве-ло к тому, что стал актуальным учет потенциальных угроз, связанных с атаками на биометрические си-стемы аутентификации, которые основаны на вос-произведении речи. В работе предложен подход к де-тектированию подобных атак при помощи ансамбля из нескольких классификаторов. В качестве инфор-мативных признаков речевого сигнала применя-лись Q-константные кепстральные коэффициенты. Проводилась их нормализация путем вычитания кепстрального среднего, оцениваемого на коротком временном интервале. Множество использованных бинарных классификаторов состояло из алгоритма на гауссовых смесях, гауссового вероятностного ли-нейного дискриминантного анализа в сочетании с из-влечением i-векторов речевых сигналов и алгоритма XGBoost. Смешивание осуществлялось при помощи модифицированного алгоритма логистической ре-грессии. Качество работы предложенного подхода оказалось существенно выше базового метода, осно-ванного на применении смесей гауссовых распреде-лений. Дополнительное существенное улучшение ка-чества было связано с предобработкой кепстральных коэффициентов. Было показано, что качество рабо-ты, близкое к наилучшему, может быть достигнуто при смешивании небольшого числа классификаторов. Достигнутое значение частоты ошибок EER = 12.44% для смеси классификаторов близко к лучшим из до-стигнутых к нынешнему моменту.Ключевые слова: верифик...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.