En este artículo se presentan los resultados obtenidos al aplicar el modelo de clasificación basado en árboles de decisión, con el fin de detectar factores asociados al desempeño académico de los estudiantes colombianos de grado undécimo de educación media, que presentaron las pruebas Saber 11° en los años 2015 y 2016. La investigación fue de tipo descriptivo bajo el enfoque cuantitativo, aplicando un diseño no experimental. Siguiendo la metodología CRISP-DM, se seleccionó, de las bases de datos del ICFES, la información socioeconómica, académica e institucional de estos estudiantes. Se construyó, limpió y transformó un repositorio de datos y utilizando la herramienta de minería de datos WEKA, se generaron árboles de decisión que permitieron identificar patrones asociados al buen o mal desempeño académico de los estudiantes en las pruebas Saber 11°. Los patrones descubiertos ayudarán en los procesos de toma de decisiones del Ministerio de Educación Nacional, junto con las instituciones que velan por la calidad de la educación en Colombia.
Aplicación de los árboles de decisión en la identificación de patrones de lesiones fatales por causa externa en el municipio de Pasto, ColombiaApplication of decision trees in the identification of patterns of fatal injuries by external cause in the municipality of Pasto, ColombiaRicardo Timarán-Pereira 1* orcid.org/0000-0002-0006-6654Andrés Calderón-Romero 2 orcid.org/0000-0002-7396-413XArsenio Hidalgo-Troya 3 orcid.org/0000-0003-4080-118X Resumen Introducción: La Organización Panamericana de la Salud (OPS) desde el año 1993 y la Organización Mundial de la Salud (OMS) en 1996, aceptaron que la violencia es un problema de salud pública, situación que se corrobora en el Informe de Violencia y Salud, en el cual América Latina presentó una tasa de homicidios de 18 por cada 100.000 personas, y es considerada como una de las regiones más violentas del mundo. Objetivo: Detectar patrones delictivos con técnicas de minería de datos en el Observatorio del Delito del municipio de Pasto (Colombia). Materiales y métodos: Se aplicó Cross Industry Standard Process for Data Mining (CRISP-DM), una de las metodologías utilizadas en el desarrollo de proyectos de minería de datos en los ambientes académico e industrial. La fuente de información fue el Observatorio del Delito del municipio de Pasto, donde está almacenadas las cifras históricas, limpias y transformadas sobre las lesiones de causa externa (fatales y no fatales), registrados en 11 años. Resultados: Se construyó un modelo de clasificación basado en árboles de decisión que permitió descubrir patrones de muertes por causa externa. Para el caso de homicidios, estos sucedieron en su mayoría en la Comuna 5 de Pasto, los fines de semana, en la madrugada, en el segundo semestre del año, en la vía pública y las víctimas fueron hombres adultos, de oficios varios, la causa de los homicidios fueron riñas y se produjeron con arma de fuego. Conclusión: El conocimiento generado ayudará a los organismos gubernamentales y de seguridad a tomar decisiones eficaces en lo relacionado a la implementación de planes de prevención de delitos y seguridad ciudadana.Palabras clave: Reconocimiento de normas patrones automatizadas; minería de datos; árboles de decisión; clasificación. (Fuente: DeCS, Bireme). AbstractIntroduction: The Pan American Health Organization (PHO) and the World Health Organization (WHO) accepted, since the year 1993 and 1996 respectively, that violence is a public health problem, a situation that is corroborated in the report on violence and health, in which Latin America presented a homicide rate of 18 per 100,000 people, and it is considered one of the most violent regions in the world. Objective: To detect criminal patterns with data mining techniques in the Crime Observatory of the municipality of Pasto (Colombia). Materials and methods: Cross Industry Standard Process for Data Mining (CRISP-DM) was applied, which is one of the methodologies used in the development of data mining projects in academic and industrial environments. The source of information was the
ResumenEn este artículo se presenta uno de los resultados del proyecto de investigación denominado: Detección de patrones de supervivencia en mujeres con cáncer invasivo de cuello uterino con técnicas de minería de datos, utilizando como fuente principal la información almacenada en la base de datos del Registro Poblacional de Cáncer del Municipio de Pasto (Colombia). Aplicando la metodología para proyectos de minería de datos CRISP-DM, se construyó, limpió y transformó un repositorio de datos con la información de las mujeres que fueron diagnosticadas con cáncer invasivo de cuello uterino entre los años 1998 y 2002, con una ventana de observación hasta el 2007. Se detectaron los principales factores socioeconómicos y clínicos asociados con la supervivencia de este grupo poblacional, utilizando las tareas de minería de datos: clasificación, asociación y agrupación. El patrón principal descubierto es aquel que caracteriza a una mujer con cáncer invasivo de cuello uterino como sobreviviente, si sobrepasa los 52 meses después del momento del diagnóstico del cáncer.Palabras clave: cáncer de cuello uterino, CRISP-DM, patrones de supervivencia, minería de datos. AbstractIn this paper, one of the results of the research project entitled: Detection of survival patterns in diagnosed women with invasive cervical cancer with data mining techniques, using as the main source the information stored in the database of Cancer Registry of the Municipality of Pasto (Colombia) is presented here. Applying the CRISP-DM methodology, a data repository with information from diagnosed women with invasive cervical cancer during the period between 1998 and 2002 with an observation window until 2007, was built, cleaned, and transformed. The main socioeconomic and clinical factors related to survival of this population group, using classification, association, and clustering tasks were detected. The principal pattern discovered was that if a woman exceeds 52 months after the time of diagnosis of invasive cervical cancer, she will be characterized as a cancer survivor.
Las pruebas Saber 5° buscan contribuir al mejoramiento de la calidad de la educación en Colombia. Su aplicación es periódica, evalúa las competencias básicas de los estudiantes y analiza los factores que inciden en sus logros. En este artículo se presenta uno de los resultados de una investigación cuyo objetivo fue aplicar técnicas de minería de datos para detectar patrones de desempeño académico en la competencia de matemáticas de las pruebas Saber 5º del año 2017. Esta prueba fue presentada por los estudiantes de grado quinto de las instituciones educativas colombianas de Básica Primaria. Para cumplir con este objetivo, se utilizó la metodología CRISP-DM. Se obtuvo información socioeconómica, académica e institucional de las bases de datos del ICFES. Esta información fue preprocesada utilizando técnicas de limpieza y transformación de datos. Se seleccionó el modelo de clasificación por árboles de decisión por su facilidad para interpretar patrones. Entre los factores más importantes de los patrones asociados al buen o mal desempeño académico en matemáticas están la naturaleza y la zona de ubicación del colegio y si el estudiante reprobó o no grado. El conocimiento generado en esta investigación constituye información de calidad para la toma de decisiones del Ministerio de Educación Nacional, las secretarias de educación y las directivas de las instituciones educativas de Básica Primaria en la definición de planes de mejoramiento que redunden en la calidad de la educación en Colombia.
En este artículo se presenta uno de los resultados del proyecto de investigación cuyo objetivo fue definir nuevosoperadores algebraicos y nuevas primitivas SQL para el Descubrimiento de Conocimiento en una arquitecturafuertemente acoplada con un Sistema Gestor de Bases de Datos Relacional (SGBDR). Se propone el método trespasoscon el fin de facilitar el acoplamiento fuerte y soportar tareas de minería de datos al interior del motor de unSGBDR. En el primer paso, se extiende el álgebra relacional con nuevos operadores algebraicos que faciliten losprocesos computacionales más costosos de las tareas de minería de datos. En el siguiente paso y con el fin de queel lenguaje SQL sea relacionalmente completo, estos operadores son definidos como nuevas primitivas SQL en lacláusula SELECT. En el último paso, estas primitivas son unificadas en un nuevo operador SQL que ejecuta unatarea específica de minería de datos. Aplicando este método, se definieron nuevos operadores algebraicos, nuevasprimitivas y operadores SQL para las tareas de Asociación y Clasificación y fueron implementados al interiordel motor del SGBD PostgreSQL, dotándolo de la capacidad para descubrir reglas de asociación y clasificacióneficientemente.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.