Система обнаружения атак воспроизведением речи, основанная на смеси алгоритмов классификации А.А. Лепендин, Я.А. Филин, П.В. Малинин Алтайский государственный университет (Барнаул, Россия) Fast development of modern technologies of digital processing and speech recording leads to the fact that it is necessary to take into account the potential threats from the speech replay attacks. We propose our ensemble fusion replay attack detection system. It uses constant Q cepstral coefficients as speech features and short-time mean normalization for their preprocessing. The set of binary classifiers includes multiple Gaussian mixture models based Bayesian classifier, i-vector based Gaussian Probabilistic Linear Discriminant Analysis and XGBoost tree boosting algorithm. Fusion of scores was made by modified logistic regression algorithm from BOSARIS toolbox. ASV Spoof 2017 corpus is utilized in the experiments as the main database for anti-spoofing systems evaluation. Obtained results demonstrate that the proposed system can provide substantially better performance than the baseline Gaussian mixture model classifier. The pre-processing of cepstral features is crucial for the better performance of the system. High evaluation performance can be obtained using only few algorithms in a set. The attained value of equal error rate EER=12.44% for our fusion classifier is competitive with the best results obtained during last two years.Keywords: automatic speaker verification; voice spoofing; replay attacks; universal background model; i-vector; probabilistic linear discriminant analysis; tree boosting; model fusion.Быстрое развитие современных технологий циф-ровой обработки и записи речевых сигналов приве-ло к тому, что стал актуальным учет потенциальных угроз, связанных с атаками на биометрические си-стемы аутентификации, которые основаны на вос-произведении речи. В работе предложен подход к де-тектированию подобных атак при помощи ансамбля из нескольких классификаторов. В качестве инфор-мативных признаков речевого сигнала применя-лись Q-константные кепстральные коэффициенты. Проводилась их нормализация путем вычитания кепстрального среднего, оцениваемого на коротком временном интервале. Множество использованных бинарных классификаторов состояло из алгоритма на гауссовых смесях, гауссового вероятностного ли-нейного дискриминантного анализа в сочетании с из-влечением i-векторов речевых сигналов и алгоритма XGBoost. Смешивание осуществлялось при помощи модифицированного алгоритма логистической ре-грессии. Качество работы предложенного подхода оказалось существенно выше базового метода, осно-ванного на применении смесей гауссовых распреде-лений. Дополнительное существенное улучшение ка-чества было связано с предобработкой кепстральных коэффициентов. Было показано, что качество рабо-ты, близкое к наилучшему, может быть достигнуто при смешивании небольшого числа классификаторов. Достигнутое значение частоты ошибок EER = 12.44% для смеси классификаторов близко к лучшим из до-стигнутых к нынешнему моменту.Ключевые слова: верифик...