A computação científica demanda poder computacional de alto desempenho principalmente para resolver em tempo hábil problemas conhecidos como “grandes desafios”. Devido à limitação de clock, cada vez mais arquiteturas não-convencionais construídas com processadores conhecidos como commodity estão sendo utilizadas nesta tarefa, como por exemplo os ambientes multi-cluster. Atualmente, a inserção de processadores com múltiplos núcleos nas configurações de cluster cria um cenário diferenciado no que diz respeito à comunicação entre processos paralelos nestes ambientes. Nesse contexto, o presente artigo vem para ampliar a discussão e apontar possibilidades de ganho em desempenho e eficiência. Os resultados empíricos obtidos com a execução do modelo numérico de previsão do tempo WRF (Weather Research and Forecasting Model) revelaram speedup de 1.39 resultante da adequação do subsistema de comunicação entre processos às especificidades da aplicação e do cluster multi-core em foco, o que reforça a importância da análise e a pertinência deste trabalho.