ABSTRACT:The study of non-technical losses affecting energy trading companies has guided the researchers' perspective on different techniques and tools that allow them to detect, and why not, to forecast such losses. In the search for a solution to the problem, the different researchers rely on variables that, in many cases, the same marketing companies, from their practical experience, have been considered as incidents in the identification of the problem. However, most of the studies carried out do not support their solutions with the fact that each trading company retains particular data in which both, technical and socio-economic characteristics recorded, are not necessarily shared in their databases. In this work, we follow up on some of the characteristics registered by two Colombian energy trading companies, which serve two different regions of the country in terms of topography and idiosyncrasy. In particular, attention is focused on two characteristics measured in both companies, which by their nature, will always be on the data of any energy trading company: Consumption in kWh, and the period, measured in months. For this purpose, Benford curves analysis, MultiDimensional Scaling (MDS), and hierarchical cluster will be implemented. Finally, it will be studied if the incidence of the variables visualized in the studies presented is reflected in the decision tree model.
RESUMEN:El estudio de las pérdidas no técnicas que afectan a las empresas comercializadoras de energía ha orientado la mirada de los investigadores hacia diferentes técnicas y herramientas que les permitan detectar y pronosticar dichas pérdidas. En la búsqueda de una solución al problema los diferentes investigadores se apoyan en variables que, en muchos casos, las mismas empresas comercializadoras, desde su experiencia práctica han determinado como incidentes en la identificación del problema. Sin embargo, la mayor parte de los estudios realizados no anteponen a sus soluciones el hecho de que cada empresa comercializadora registra en su conjunto de datos una serie de características, tanto técnicas como socioeconómicas, que no necesariamente comparten entre ellas. En este trabajo se hace seguimiento a algunas de las características registradas por dos empresas comercializadores de energía colombianas, las cuales atienden dos regiones diferentes del país en cuanto a topografía, e idiosincrasia. De manera particular, se centra la atención en dos características medidas en ambas empresas, y que, por su naturaleza, siempre estarán en los datos de cualquier empresa comercializadora de energía, El Consumo en kWh, y el Periodo, medido en meses. Con este propósito se implementarán análisis de curvas Benford, escalamiento multidimensional MDS, y clúster jerárquico, para finalizar estudiando finalmente si la incidencia de las variables visualizada en los estudios planteados se refleja en el modelo de árboles de decisión.