IEEE ICASSP 2016 - International Conference on Acoustics, Speech and Signal Processing, Shanghai, Chine, 20-/03/2016 - 25/03/2016International audienceDeep Neural Networks (DNNs) have recently become a popular technique for regression and classification problems. Their capacity to learn high-order correlations between input and output data proves to be very powerful for automatic speech recognition. In this paper we investigate the use of DNNs for automatic scream and shouted speech detection, within the framework of surveillance systems in public transportation. We recorded a database of sounds occurring in subway trains in real conditions of exploitation and used DNNs to classify the sounds into screams, shouts and other categories. We report encouraging results, given the difficulty of the task, especially when a high level of surrounding noise is present.Les réseaux de neurones profonds sont devenues récemment une technique populaire pour les problèmes de régression et de classification. Leur capacité d'apprendre des corrélations d'ordre éleÎ entre des entrées et des données de sortie s'aÏre être très un puissant outil pour reconnaissance automatique de la parole. Dans cet article, nous étudions l'utilisation des réseaux de neurones profonds pour la détection automatique de cris et de parole criée dans le cadre de systèmes de surveillance dans les transports publics. Pour cela, une base de données sonores a été enregistrée dans une rame de métro en condition réelle d'exploitation. Dans ce contexte, la détection de cri est réalisée via un classement de divers types de production de la parole dont des cris. Nous obtenons des résultats encourageants étant donné la difficulté de la tâche, en particulier vis-à-vis du haut niveau de bruit sonore environnant
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.