ResumoUm dos principais problemas atualmente para analisar longas séries de dados no Brasil é a falta de um banco de dados diários consistentes de estações meteorológicas. Diante disso, o objetivo deste trabalho é avaliar a acurácia do método de imputação múltipla Predictive Mean Matching (PMM) no preenchimento de dados faltantes de séries diárias de precipitação para a Bacia Hidrográfica do Médio São Francisco (BMSF). Para isso foram adquiridos dados diários de chuva cedidos pelo Instituto Nacional de Meteorologia (INMET) das estações de Bom Jesus da Lapa (BA), Carinhanha (BA), João Pinheiro (MG), Remanso (BA) e Unaí (MG), para o período de 2001 a 2017. Em seguida, dois cenários foram criados com 5% e 15% de falhas para avaliar a precisão do método PMM no preenchimento de dados faltantes. As séries originais, sem falhas, e as preenchidas pelo método adotado apresentaram uma correlação alta (r > 0,80), que consiste numa boa relação entre elas. O coeficiente de determinação (R 2 ) foi de 0,7 (0,6) para 5% (15%) de falhas. Além disso, o Erro Médio Absoluto e o Erro Quadrático Médio foram baixos para todas as estações. Também foi aplicado o teste de Wilcoxon, o qual verificou a boa acurácia na aplicação do método PMM para preencher os dados faltantes de chuva.
AbstractOne of the main problems currently in analyzing long data sets in Brazil is the lack of a consistent database of daily weather stations. Therefore, the objective of this work is to evaluate the accuracy of the Predictive Mean Marching (PMM) multiple imputation method in filling missing data from daily rainfall series. For this purpose, daily rainfall data from the National Institute of Meteorology (INMET) from Bom Jesus da Lapa (BA), Carinhanha (BA), João Pinheiro (MG), Remanso (BA) and Unaí (MG) stations were acquired from the period 2001 to 2017. Then two scenarios were created with 5% and 15% failures so that it was possible to evaluate the accuracy of the PMM method for filling in missing data. The original series, without fail, and the ones completed by the adopted method presented a high correlation (r> 0.80), which consists of a good relationship between them, and coefficient of determination (R 2 ) was 0.7 (0.6) for 5% (15%) failures. In addition, Absolute Mean Error and Mean Square Error were low for all seasons. The Wilcoxon test was also applied, which verified the good accuracy in the application of the PMM method to fill in the missing rainfall data.