Un cliente insatisfecho por algún producto y/o servicio se encuentra motivado a expresar una queja. Clasificar las quejas de forma manual es un proceso que representa elevados costos en recursos humanos y materiales. La Inteligencia Artificial (IA) permite el uso de diversos algoritmos para realizar tareas que pueden simular la inteligencia humana, una rama de esta es el Procesamiento de Lenguaje Natural (NLP por sus siglas en inglés), tiene por objetivo que las máquinas tengan la capacidad de entender lenguaje humano, permitiendo, por ejemplo clasificar y categorizar datos de forma automática. Este artículo proporciona una revisión sistemática de la literatura abordando desafíos en la clasificación de textos de queja, tales como la falta de balance de clases, la presencia de datos sin etiquetar y la interpretación de los resultados de los modelos. Se exploran técnicas de pre procesamiento, como la tokenización, la remoción de stopwords y la lematización, que influyen en el rendimiento de los modelos. Adicionalmente, se discuten las métricas de rendimiento como precision, recall y F1-score. Se muestran las tendencias actuales y futuras líneas de investigación. Para tal fin se analizaron 24 artículos publicados entre 2018 y 2023 extraídas de las bases de datos de Web of Science y Scopus.