Se presenta el escalamiento multidimensional como estrategia alternativa para tratar el problema de multicolinealidad en el análisis de regresión múltiple, cuando las variables regresoras son cualitativas, cuantitativas o mixtas (cuantitativas y cualitativas) y la variable respuesta es continua. El propósito es obtener la matriz de coordenadas principales usando como métrica la distancia de Gower si las variables predictoras son mixtas o, en caso contrario, otra distancia de tipo Euclideana, y a partir de esta matriz estimar el modelo de regresión. Para observar las bondades del método propuesto, se realizan dos casos de simulación: el primero sin presencia de multicolinealidad y el segundo con presencia de multicolinealidad. Se muetran dos casos de aplicación analizados por [46] mediante regresión múltiple, en los casos simulados y en las aplicaciones se utilizó el paquete estadístico R. Los resultados de las simulaciones y aplicaciones se comparan con la regresión múltiple clásica y la basada en componentes principales. El análisis propuesto es una alternativa de modelamiento que corrige la colinealidad y permite trabajar con variables explicativas sin pérdida de información; además, esta técnica al transformar las variables originales en coordenadas, en su modelamiento logra ocultar el efecto de las variables observadas, de manera que no se manipulen los resultados.Palabras clave: Colinealidad, Coordenadas Principales, Distancia de Gower, Regresión Múltiple, Componentes Principales.
AbstractWe present the multidimensional scaling analysis as an alternative strategy to treat the multicollinearity problem in the multiple regression analysis, when the regressor variables are qualitative, quantitative or mixed (quantitative and qualitative) and the response variable is continuous. Our purpose is to obtain the matrix of the principal coordinates, using as a metric the Gower distanc when the predictives variables are mixed, or otherwise, the researcher must select an appropriate Euclidean distance and with this matrix to Sara C. oomelom@unal.edu.co estimate the regression model. To observe the kindness of the proposed method, two cases of simulation are realized: the first one without presence of multicolinearity and the second one with presence of multicolinearity. Two application cases are illustrated, which were analyzed by [46] using multiple regressions. In both cases simulated and in the applications, the R package was used. The results of the simulations and applications are compared with the classical multiple regression and regression based on principal component . The analysis strategy proposal is an alternative modeling that corrects collinearity, and allows work with predicted variables without loss of information, Additionally, this technique when transforming the original variables into coordinates, in its modeling hides the effect of the observed variables, so that the results are not manipulated.