Cet article vise à construire des modèles de prédiction de la faillite en utilisant des techniques qui prennent en considération les problèmes liés aux bases de données déséquilibrées, en appliquant des techniques de type logit, boosting et de suréchantillonnage à un ensemble de données déséquilibré de 2266 entreprises belges. La technique de suréchantillonnage des minorités synthétiques (SMOTE) est utilisée pour tester la précision des modèles sur différentes proportions d’échantillons déséquilibrés. Les résultats démontrent que l’utilisation de techniques prenant en compte le problème de déséquilibrage des données offre une meilleure précision de prédiction, notamment en réduisant le taux d’erreur de type I, qui constitue l’erreur économique la plus coûteuse. Cette étude offre des pistes intéressantes pour les investisseurs, les fournisseurs, les banquiers et les gouvernements.