Resumo -O objetivo deste trabalho foi realizar a expansão de mapas pedológicos pela extrapolação de mapas preexistentes para áreas fisiograficamente semelhantes. Foram utilizados mapas de solos, em escala 1:50.000, das bacias hidrográficas dos rios Santo Cristo e Arroio Portão, no Rio Grande do Sul, e a extrapolação foi feita com uso do algoritmo de árvores de decisão "simple cart", treinado nas áreas previamente mapeadas. As bacias foram divididas em duas partes, uma para o treinamento e outra para a validação do modelo. A partir do modelo digital de elevação Aster-GDEM, foram gerados sete mapas de variáveis preditoras dos solos na paisagem. A amostragem de dados foi aleatória, com densidade de três pontos por hectare. O treinamento dos modelos foi realizado no programa Weka, e as acurácias foram calculadas a partir de matriz de erros. Para ambas as bacias, a acurácia geral do mapa de solos predito foi maior na área de treinamento do que na área de validação, a qual apresentou valores de 50 e 54%. Os mapas produzidos pelo modelo preditor apresentaram acentuada diferença na distribuição espacial das unidades de mapeamento, comparados com o mapa de solos original, indício de que a técnica de mapeamento digital utilizada é pouco eficiente para extrapolar mapas de solos preexistentes para outras áreas fisiograficamente semelhantes.Termos para indexação: acurácia geral, árvores de decisão, mineração de dados, pedometria, simple cart, sistema de informação geográfica.
Expanding pedological maps to physiographically similar areas with digital soil mappingAbstract -The objective of this work was to expand pedological maps by extrapolating existing soil maps to physiographically similar areas. Soil maps were used at the scale of 1:50,000, for the watersheds of the rivers Santo Cristo and Arroio Portão, in the state of Rio Grande do Sul, Brazil, and the extrapolation was done using the "Simple Cart" decision tree algorithm, trained in the previously mapped areas. The watersheds were divided into two parts, one used for model training and the other for model validation. From the digital elevation model Aster-GDEM, seven maps of soil predicting variables in the landscape were generated. Sampling was random and performed with sampling density of three points per hectare. Model training was performed in the Weka software, and model accuracies were calculated using the error matrix. For both watersheds, the overall accuracy of the predicted soil map was higher in the training area than in the validation area, and showed values of 50 and 54%. The maps produced by the predictive model showed acute differences in the spatial distribution of mapping units, compared with the original soil map, indicating that the used digital mapping technique has low effectivity for the extrapolation of pre-existing soil maps to other physiographically similar areas.