The occurrence of atmospheric discharges poses risks to the the company operations and workers in open-air activities. Due to this, this paper aimed to cluster lightning data, simulating realtime monitoring of storms for three different target regions. In addition, storms information were used to predict, 15-minutes earlier, the probability of a lightning strikes these areas. Using a multi-source database from ELAT/INPE, different clusterization methods were evaluated in terms of the Calinski Harabasz, Davies Bouldin and Silhouette metrics. Overall, the best one was the MeanShift which cluster the data in 3-5 storms. Number of storms, density and distance were used into a classification machine learning model to generate warning alerts. The Extreme Gradient Boosting and Support Vector Machines achieved the best results in terms of precision and recall, important metrics to evaluate true and false alerts in this context. Both the false alerts, which implies in inactivity of operations and failure rate were equal to or lower than 40%.
Resumo:A ocorrência de descargas atmosféricas gera riscos às operações e aos profissionais que atuam a céu aberto. Por isso, este trabalho simulou o monitoramento em tempo real de três regiões, utilizando informações das tempestades para prever, 15 minutos antes, a probabilidade de uma descarga atingir os alvos. Utilizando uma base de múltiplas fontes do ELAT/INPE, diferentes métodos de agrupamento foram avaliados observando as métricas Calinski Harabasz, Davies Bouldin e Silhueta. O melhor, no geral, foi o MeanShift que agrupou as descargas em 3 − 5 tempestades. O número de tempestades, intensidade e distância foram utilizados para construir um modelo de classificação para gerar alertas de advertência. Extreme Gradient Boosting e Máquinas de Vetores de Suporte apresentaram melhores resultados em precisão e revocação. Tanto a taxa de falsos alertas que implica na inatividade de operações, quanto a de falhas que indica a ausência de um alertas preventivos foram iguais ou inferiores a 40%.