RESUMOO objetivo do trabalho proposto é detectar antecipadamente possíveis ocorrências de eventos convectivos severos, por meio do monitoramento das saídas do modelo de previsão numérica de tempo Eta, para cada intervalo de previsão e para um conjunto de variáveis selecionadas. O período de estudo estende-se de janeiro a fevereiro de 2007. Classificadores foram desenvolvidos pela abordagem de similaridade de vetores e de conjuntos aproximativos, de forma a identificar saídas do modelo Eta que possam ser associados a esses eventos. Assumiu-se como premissa que os eventos convectivos severos possam ser correlacionados com grande número de ocorrências de descargas elétricas atmosféricas. Os classificadores agruparam as saídas do modelo Eta, compostas por essas variáveis, com base na densidade de ocorrência de descargas elétricas atmosféricas nuvem-solo. Ambos os classificadores apresentaram bom desempenho para os testes realizados para um período de dois meses escolhido para três mini-regiões selecionadas do território brasileiro. Palavras-Chave: mineração de dados, previsão meteorológica, eventos convectivos. ABSTRACT: METEOROLOGICAL DATA MINING FOR THE PREDICTION OF SEVERE CONVECTIVE EVENTSThis work aims the early detection of possible occurrences of severe convective events in Central and Southeast Brazil by means of monitoring the output of the Eta numerical weather prediction model for each forecasted time interval and for a selected set of variables. The studied period ranges from January to February 2007. Classifiers were developed by two approaches, vector similarity and rough sets, in order to identify Eta outputs that can be associated to such events. It was assumed that severe convective events can be correlated to a large number of atmospheric electric discharges. The classifiers grouped the Eta meteorological model outputs for these selected variables based on the density of occurrences of cloud-to-ground atmospheric electrical discharges. Both classifiers show good performance for the chosen 2-month period at the three selected mini-regions of the Brazilian territory.
The Rough Sets Theory is used in data mining with emphasis on the treatment of uncertain or vague information. In the case of classification, this theory implicitly calculates reducts of the full set of attributes, eliminating those that are redundant or meaningless. Such reducts may even serve as input to other classifiers other than Rough Sets. The typical high dimensionality of current databases precludes the use of greedy methods to find optimal or suboptimal reducts in the search space and requires the use of stochastic methods. In this context, the calculation of reducts is typically performed by a genetic algorithm, but other metaheuristics have been proposed with better performance. This work proposes the innovative use of two known metaheuristics for this calculation, the Variable Neighborhood Search, the Variable Neighborhood Descent, besides a third heuristic called Decrescent Cardinality Search. The last one is a new heuristic specifically proposed for reduct calculation. Considering some databases commonly found in the literature of the area, the reducts that have been obtained present lower cardinality, i.e., a lower number of attributes.
RESUMOCom os constantes avanços dos modelos numéricos de previsão de tempo e ondas, na execução de grades cada vez mais refinadas, sempre houve a necessidade de utilização e rápida atualização dos equipamentos e servidores que executam estes modelos, de tal forma a agilizar a previsão e efetuar cálculos com maior precisão e acurácia. A computação em nuvens, com a habilidade de virtualização de CPU's e a facilidade de manuseio nos servidores, permite que os modelos mais atuais sejam executados de forma cada vez mais rápida e precisa. Por isso, diversas empresas e comunidades científicas têm substituído os tradicionais servidores físicos pelo uso de computação nas nuvens, para o desenvolvimento de projetos e até no uso de computação de alto desempenho operacional.Este trabalho visou avaliar o desempenho dos modelos numéricos WRF (Weather Research and Forecast,[3]), na sua versão 3.5, e WW3 (WaveWatch -3rd Generation, [5]), na versão 3.14, que são rodados operacionalmente na Climatempo, em instâncias de grande uso de processamento da Amazon Web Services (AWS). Estes modelos têm apresentado bons resultados quantitativos na previsão de tempo e onda [4]. A unidade selecionada é otimizada para computação de alto desempenho, com codinome cc2.8xlarge, que tem proporcionalmente mais recursos de CPU do que memória (RAM) e são adequadas para aplicativos com processamento intensivo. Esta instância conta com 60,5 Gb de memória RAM, 88 unidades de processamento EC2, 3370 GB de armazenamento de instâncias locais, plataforma de 64 bits e conexão Ethernet de 10 Gigabits. Os processadores são Intel ® Xeon ® CPU E5-2670 0 @2.60 Ghz, totalizando 32 núcleos (16 físicos e 16 virtuais).O modelo numérico de previsão do tempo foi configurado para um passo de tempo de 30 s, com 4 grades no total, sendo a grade-mãe, abrangendo a costa brasileira, com 39 km de espaçamento horizontal, e as outras 3 grades separadas para as regiões nordeste, sudeste e sul da costa, com 13 km. Já o modelo oceânico foi ajustado com 2 grades, sendo a primeira com 1.5º de espaçamento horizontal e abrange o globo, e a segunda pega toda a costa do atlântica da América do Sul. Ambas as rodadas foram feitas para 24 horas de previsão.Para avaliação do desempenho de execução em paralelo foram escolhidos, juntamente com o tempo, os índices SpeedUp e Eficiência [2], comumente utilizados para avaliação do desempenho de modelos numéricos de previsão em clusters com vários núcleos [1].Os resultados demonstraram que o WRF é otimizado utilizando todas as unidades de processamento físico (16 cores). A partir disto, o modelo acaba diminuindo a eficiência não melhorando o tempo ou o índice de SpeedUp. Já para o modelo de ondas, a condição ótima dada com 12 núcleos, com um mínimo de eficiência para 28 núcleos. Na otimização, o tempo de execução da rodada do WRF e do WW3 foi respectivamente de 3.3 min e 6.6 min. Palavras
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.