La literatura reciente sobre valoración inmobiliaria ha aportado diversas evidencias en el ámbito internacional sobre el buen desempeño de los modelos de machine learning en la predicción del comportamiento de los precios, sobre todo si se comparan con los obtenidos por los denominados métodos tradicionales valoración, muy extendidos sobre todo en la práctica profesional. Con todo, se siguen remarcando algunas limitaciones como el diseño de caja negra y la dificultad en la interpretación de los resultados proporcionados por estas técnicas. Este trabajo tiene por objeto comparar los resultados y el desempeño de diferentes modelos de machine learning aplicados en el ámbito de la valoración inmobiliaria residencial. Para ello se ha recopilado una amplia base de datos con ofertas de inmuebles en la ciudad de Madrid, que permite dividir la muestra en los grupos de entrenamiento y test. La comparación entre los modelos se ha llevado a cabo a través de diferentes métricas, entre las que destaca el MAPE (Mean Absolute Percentage Error) por ser uno de los preferidos por las sociedades de tasación. Las métricas utilizadas confirman un buen rendimiento generalizado para el conjunto de modelos entrenados, con variaciones relativamente pequeñas tras el proceso de validación.