Resumo:O objetivo do presente trabalho é propor um método sequencial para interpolação espacial da escolha modal em domicílios não amostrados, através de técnicas de Árvore de Decisão e Geoestatística. Inicialmente, foi aplicada a técnica de Árvore de Decisão, com a finalidade de estimar a probabilidade de escolha do modo em domicílios pesquisados, determinando assim a variável numérica a ser krigada posteriormente. Os dados utilizados foram da Pesquisa OrigemDestino e da Pesquisa de Opinião sobre avaliação do transporte público, realizadas em 2007/2008 em São Carlos (SP). A área selecionada para modelagem geoestatística pelo estudo foi uma pequena região da cidade com 110 pontos amostrados. A escolha modal foi estimada na área estudada, revelando uma tendência de aumento da probabilidade do uso do carro do centro para a periferia da região. O método proposto pode ser uma alternativa às abordagens tradicionais, tanto na modelagem não-espacial, especialmente para o caso de falta de dados de pesquisa de preferência declarada, como em modelagem espacial, permitindo estimar valores em várias coordenadas geográficas.
Abstract:The main objective of this study is to propose a sequential method for spatial interpolation of mode choice for household locations where choices are unobserved based on Decision Tree analysis and Geostatistics. Initially, Decision Tree analysis was applied in order to estimate the probability of mode choice in surveyed households, thus determining the numeric variable to be estimated by Ordinary Kriging. The data used is from the Origin-Destination Survey and Urban Transportation Evaluation Survey, carried out in 2007/2008 in the city of São Carlos (São Paulo/Brazil). The study area selected for geoestatistical modeling is a small region of the city with 110 sampling points. The mode choice was estimated for the study area revealing a tendency of increasing the probability of car usage from the center to the periphery of region. The proposed method can be an alternative to traditional approaches in both non-spatial modeling, especially for the case of lack of data from stated preference survey, as in spatial modeling, allowing estimation in various geographic coordinates.