Background/objectives: Theft and burglary are two crimes against property that have a great social impact. Their prevention drastically lowers victimization rates and the feeling of insecurity in the population. The objective of this investigation is to obtain an index that allows the prediction of repeat offenses by criminals in these types of crimes, in order to support decision-making with respect to preventative actions. Methodology: In order to obtain the index, a group of machines learning was trained, with information provided by the Criminal Analysis and Investigative Focus System (CAIFS) from the Regional Public Prosecutor's Office in Biobío, Chile. The information provided was from thefts and burglaries committed between 2012 and 2017 in the city of Concepción. Findings/application: The results show a characterization of repeat offenders in these types of crime and a recurrence index that allows for a greater assertiveness in the prediction of recidivism than the method that is currently being used.
La fuga de clientes es un problema relevante al que enfrentan las empresas de servicios y que les puede generar pérdidas económicas significativas. Identificar los elementos que llevan a un cliente a dejar de consumir un servicio es una tarea compleja, sin embargo, mediante su comportamiento es posible estimar una probabilidad de fuga asociada a cada uno de ellos. Esta investigación aplica minería de datos para la predicción de la fuga de clientes en una empresa de distribución de gas natural, mediante dos técnicas de machine learning: redes neuronales y support vector machine. Los resultados muestran que mediante la aplicación de estas técnicas es posible identificar los clientes con mayor probabilidad de fuga para tomar sobre estas acciones de retenciónoportunas y focalizadas, minimizando los costos asociados al error en la identificación de estos clientes. Palabras Clave: fuga de clientes, minería de datos, machine learning, distribución de gas natural. Referencias [1]J. Miranda, P. Rey y R. Weber, «Predicción de Fugas de Clientes para una Institución Financiera Mediante Support Vector Machines,» Revista Ingeniería de Sistemas Volumen XIX, pp. 49-68, 2005. [2]P. A. Pérez V., «Modelo de predicción de fuga de clientes de telefonía movil post pago,» Universidad de Chile, Santiago, Chile, 2014. [3]Gas Sur S.A., «https://www.gassur.cl/Quienes-Somos/,» [En línea]. [4]J. Xiao, X. Jiang, C. He y G. Teng, «Churn prediction in customer relationship management via GMDH-based multiple classifiers ensemble,» IEEE IntelligentSystems, vol. 31, nº 2, pp. 37-44, 2016. [5]A. M. Almana, M. S. Aksoy y R. Alzahrani, «A survey on data mining techniques in customer churn analysis for telecom industry,» International Journal of Engineering Research and Applications, vol. 4, nº 5, pp. 165-171, 2014. [6]A. Jelvez, M. Moreno, V. Ovalle, C. Torres y F. Troncoso, «Modelo predictivo de fuga de clientes utilizando mineríaa de datos para una empresa de telecomunicaciones en chile,» Universidad, Ciencia y Tecnología, vol. 18, nº 72, pp. 100-109, 2014. [7]D. Anil Kumar y V. Ravi, «Predicting credit card customer churn in banks using data mining,» International Journal of Data Analysis Techniques and Strategies, vol. 1, nº 1, pp. 4-28, 2008. [8]E. Aydoğan, C. Gencer y S. Akbulut, «Churn analysis and customer segmentation of a cosmetics brand using data mining techniques,» Journal of Engineeringand Natural Sciences, vol. 26, nº 1, 2008. [9]G. Dror, D. Pelleg, O. Rokhlenko y I. Szpektor, «Churn prediction in new users of Yahoo! answers,» de Proceedings of the 21st International Conference onWorld Wide Web, 2012. [10]T. Vafeiadis, K. Diamantaras, G. Sarigiannidis y K. Chatzisavvas, «A comparison of machine learning techniques for customer churn prediction,» SimulationModelling Practice and Theory, vol. 55, pp. 1-9, 2015. [11]Y. Xie, X. Li, E. Ngai y W. Ying, «Customer churn prediction using improved balanced random forests,» Expert Systems with Applications, vol. 36, nº 3, pp.5445-5449, 2009. [12]U. Fayyad, G. Piatetsky-Shapiro y P. Smyth, «Knowledge Discovery and Data Mining: Towards a Unifying Framework,» de KDD-96 Proceedings, 1996. [13]R. Brachman y T. Anand, «The process of knowledge discovery in databases,» de Advances in knowledge discovery and data mining, 1996. [14]K. Lakshminarayan, S. Harp, R. Goldman y T. Samad, «Imputation of Missing Data Using Machine Learning Techniques,» de KDD, 1996. [15]B. Nguyen , J. L. Rivero y C. Morell, «Aprendizaje supervisado de funciones de distancia: estado del arte,» Revista Cubana de Ciencias Informáticas, vol. 9, nº 2, pp. 14-28, 2015. [16]I. Monedero, F. Biscarri, J. Guerrero, M. Peña, M. Roldán y C. León, «Detection of water meter under-registration using statistical algorithms,» Journal of Water Resources Planning and Management, vol. 142, nº 1, p. 04015036, 2016. [17]I. Guyon y A. Elisseeff, «An introduction to variable and feature selection,» Journal of machine learning research, vol. 3, nº Mar, pp. 1157-1182, 2003. [18]K. Polat y S. Güneş, «A new feature selection method on classification of medical datasets: Kernel F-score feature selection,» Expert Systems with Applications, vol. 36, nº 7, pp. 10367-10373, 2009. [19]D. J. Matich, «Redes Neuronales. Conceptos Básicos y Aplicaciones,» de Cátedra: Informática Aplicada ala Ingeniería de Procesos- Orientación I, 2001. [20]E. Acevedo M., A. Serna A. y E. Serna M., «Principios y Características de las Redes Neuronales Artificiales, » de Desarrollo e Innovación en Ingeniería, Medellín, Editorial Instituto Antioqueño de Investigación, 2017, pp. Capítulo 10, 173-182. [21]M. Hofmann y R. Klinkenberg, RapidMiner: Data mining use cases and business analytics applications, CRC Press, 2016. [22]R. Pupale, «Towards Data Science,» 2018. [En línea]. Disponible: https://towardsdatascience.com/https-medium-com-pupalerushikesh-svm-f4b42800e989. [23]F. H. Troncoso Espinosa, «Prediction of recidivismin thefts and burglaries using machine learning,» Indian Journal of Science and Technology, vol. 13, nº 6, pp. 696-711, 2020. [24]L. Tashman, «Out-of-sample tests of forecasting accuracy: an analysis and review,» International journal of forecasting, vol. 16, nº 4, pp. 437-450, 2000. [25]S. Varma y R. Simon, «Bias in error estimation when using cross-validation for model selection,» BMC bioinformatics, vol. 7, nº 1, p. 91, 2006. [26]N. V. Chawla, K. W. Bowyer, L. O. Hall y W. Kegelmeyer, «SMOTE: Synthetic Minority Over-sampling Technique,» Journal of Artificial Inteligence Research16, pp. 321-357, 2002. [27]M. Sokolova y G. Lapalme, «A systematic analysis of performance measures for classification tasks,» Information processing & management, vol. 45, nº 4, pp. 427-437, 2009. [28]S. Narkhede, «Understanding AUC-ROC Curve,» Towards Data Science, vol. 26, 2018. [29]R. Westermann y W. Hager, «Error Probabilities in Educational and Psychological Research,» Journal of Educational Statistics, Vol 11, No 2, pp. 117-146, 1986.
Predicting the number of crimes that will be committed in a certain geographical area is important for the management of resources destined for crime prevention. This research develops two predictive models of time series for the geographic prediction of property crimes in two districts of Chile Talcahuano and Hualpén. The models investigated were Neural Networks and SARIMA. Both models were trained and tested with the information provided by the Regional Prosecutor's Office of BioBío, Chile. The information contains the crimes against property committed in both districts between 2009 and 2019. The models were compared using the MAPE, MAD, and MSE forecast error measures. The comparison of the results does not show statistically significant differences between the results of both models. Keywords: Predictive Model, Time Series, Neural Networks, Crime Analitycs.
Para la georreferenciación de un gran número de direcciones, es necesaria la previa geocodificación mediante sistemas de carácter público o privado. La geocodificación no es una ciencia exacta porque las direcciones generalmente son escritas y almacenadas por personas, lo que provoca diferentes problemas de precisión en el registro, como errores ortográficos, datos innecesarios o falta de datos mínimos. Para enfrentar este problema, en este artículo se describe una metodología que limpia y corrige las direcciones optimizando el proceso de geocodificación utilizando los sistemas existentes. Para su desarrollo se utiliza el proceso Knowledge Discovery in Text (KDT). La metodología se aplica a una base de datos de direcciones de hechos delictivos proporcionada por la unidad de análisis penal de la Fiscalía Regional del Biobío, Chile. Los resultados muestran un aumento en el número de geocodificaciones de los sistemas implementados, que varía según el sistema utilizado. Palabras Clave: Georreferenciación, Geocodificación, Minería de Texto. Referencias [1]C. Davis y F. Fonseca, «Assessing the Certainty of Locations Produced by an Address Geocoding System,» Geoinformatica, vol. 11, pp. 103-129, 2007. [2]L. Hill, «Georeferencing in Digital Libraries,» D-Lib Magazine, vol. 10, nº 5, 2004. [3]J. Pontón y A. Santillán, «Seguridad Ciudadana: escenarios y efectos,» 2008. [4]D. W. Goldberg, «Spatial approaches to reducing error in geocoded data,» 2010. [5]D.-H. Yang, L. M. Bilaver, O. Hayes y R. Goerge, «Improving Geocoding Practices: Evaluation of Geocoding Tools,» Journal of Medical Systems, vol. 28, pp. 361-370, 2004. [6]T. Ah-Hwee, «Text mining: The state of the art and the challenges,» de PAKDD’99 workshop on Knowledge Discovery from Advanced Databases, Beijing, 1999. [7]R. Feldman y I. Dagan, «Knowledge discovery in textual databases,» de First International Conference on Knowledge Discovery and Data Mining (KDD-95), 1995. [8]M. d. C Justicia de la Torre , «Nuevas Tecnicas de Mineria de Textos: Aplicaciones,» Granada, 2017. [9]M. Lutz, Programming Python, vol. 2, O'reilly & Associates, 2001, pp. 1-10. [10]W. McKinney, Python For Dara Analysis, O'Reilly, 2012, pp. 111-152. [11]E. Ukkonen, «Algorithms for Approximate String Matching,» de International Conference on Foundations of Computation Theory, 1985. [12]M. A. Alvarez Carmona, «Deteccion de similitud en textos cortos considerando traslape, ordeny relacion semantica de palabras,» Tonantzintla, Puebla, 2014. [13]V. I. Levenshtein, «Binary Codes Capble Of Correcting Deletions, Insertions, and Reversals,» Soviet Physics Doklady, vol. 10, p. 707, 2 February 1966. [14]Google, «Google Maps Plataform,» 2020. [En línea]. Disponible: https://developers.google.com/maps/documentation/javascript/geocoding?hl=es-419. [Último acceso: 29 Julio 2020]. [15]Mapquest, «Mapquest Developer,» 2020. [En línea]. Disponible: https://developer.mapquest.com/. [Último acceso: 25 Julio 2020]. [16]Microsoft Corporation, «Bing Maps Dev Center,» 2020. [En línea]. Disponible: https://www.bingmapsportal.com/. [Último acceso: 29 Julio 2020]. [17]Open Street Map Wiki, 2020. [En línea]. Disponible: https://wiki.openstreetmap.org/wiki/Main_Page. [Último acceso:29 Julio 2020]. [18]OpenAdrdresses, «OpenAdrdresses,» 2020. [En línea]. Disponible: https://openaddresses.io/. [Último acceso: 25 Julio 2020]. [19]OpenCage Geocoder, 2020. [En línea]. Disponible: https://opencagedata.com/. [Último acceso: 29 Julio 2020]. [20]Yahoo, «Yahoo Developer,» 2016. [En línea]. Disponible:https://developer.yahoo.com/. [Último acceso: 14 Agosto 2020]. [21]K. Jordahl, J. Van Den Bossche y J. Wasserman, «Geopandas/Geopandas: V0. 4.1. Zenodo,» 2020.
Este trabajo describe el área de la telemedicina como herramienta de gestión para el sistema público de salud en Chile. Se incluye las tres áreas relevantes como lo son la descripción de los procesos involucrados, las tecnologías de la información utilizadas y los diversos recursos humanos y materiales necesarios para aumentar la calidad de los servicios ofrecidos a los pacientes a través de los hospitales públicos en la Octava región en Chile. Se describe un proyecto de teleasistencia financiado por organismos del Estado y se muestran sus resultados preliminares. Además se identifican áreas futuras de desarrollo con el fin de incentivar a profesionales de la ingeniería para que se involucren en la investigación y desarrollo del sistema público de salud.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.