Com o avanço da tecnologia e sua dependência no cotidiano, a computação de alto desempenho (HPC) passou a ser uma das principais áreas de pesquisa e investigação na computação. Os ambientes de alto desempenho são comumente utilizados em aplicações que necessitam processar uma variedade de informações e obter o resultado em um tempo limitado para a aplicação. Por conta disso, os ambientes de alto desempenho devem trabalhar de forma eficiente para atender as demandas da aplicação e obter os resultados de forma rápida. Para que um ambiente de alto desempenho trabalhe de forma otimizada, é fundamental a escolha de um sistema gerenciador de recursos (SGR) eficiente que atenda as necessidades do da aplicação em questão. Por esse motivo, o objetivo deste trabalho foi avaliar e comparar a performance de dois SGRs SLURM e OAR em uma aplicação científica real de previsão ionosférica, a fim de verificar qual deles atende melhor as necessidades e requisitos para essa aplicação. Os experimentos foram realizados em um cluster de uso dedicado localizando no Centro Regional Sul do INPE em Santa Maria, e possui 5 nós de processamento e um de controle. Foram realizados experimentos para quatro dias diferentes, e após avaliadas estatísticas referentes a taxa média de uso de CPU, memória e tempo total de execução. O SLURM apresentou melhores resultados na grande maioria das avaliações, incluindo um menor tempo total de processamento para os quatro dias simulados, quando comparado à solução com o OAR.
This paper describes an experimental study on the effect of reducing time series collected from IoT electrical agro-sensors through approximation techniques, in time series classification tasks, for plant stress detection. From large sets of real data, stored in time series format, experiments were carried out to analyze: (i) performance of mathematical methods to reduce the dimensionality of time series - PAA, SAX and MCB; and (ii) Whether the application of these techniques influences the performance of time series classification models for plant stress detection, using machine learning algorithms KNN, SVM and ANN. Both in terms of data volume reduction and time series classification, the experiment showed significant improvements in terms of compression rate and accuracy, with the best result found in the use of PAA+SAX techniques for reduction and SVM for classification.
Com a constante evolução da tecnologia, a computação de alto desempenho é uma das principais áreas de pesquisa no meio computacional. Os ambientes de alto desempenho são frequentemente usados por aplicações que necessitam lidar com uma grande quantidade de dados em um curto período de tempo. Para isso, podem ser usados sistemas distribuídos visando o aumento da eficiência e a velocidade de execução. Com a grande quantidade de recursos computacionais em ambientes de alto desempenho, sistemas gerenciadores de recursos, como OAR e SLURM, são empregados para otimizar a sua utilização. Neste trabalho, realizamos uma análise comparativa dos sistemas gerenciadores mencionados em uma aplicação científica real, que simula diariamente o comportamento da ionosfera terrestre na América do Sul através da geração de mapas de conteúdo eletrônico total.
In High Performance Computing, it is common to deal with substantial computing resources, and the use of a Resource Management System (RMS) becomes fundamental. The job scheduling algorithm is a key part of a RMS, and the selection of the best job scheduling that meets the user needs is of most relevance. In this work, we use a real-world scientific application to evaluate the performance of 4 different job scheduling algorithms: First in, first out (FIFO), Shortest Job First (SJF), EASY-backfilling and Fattened-backfilling. These algorithms worked with RMS SLURM workload manager, considering a scientific application that predicts the earth’s ionosphere dynamics. In the results we highlight each algorithm’s strength and weakness for different scenarios that change the possibility of advancing smaller jobs. To deepen our analysis, we also compared the job scheduling algorithms using 4 jobs of Numerical Aerodynamic Sampling (NAS) Parallel Benchmarks in a controlled scenario.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.