Inflation forecasting is an important but difficult task. Here, we explore advances in machine learning (ML) methods and the availability of new datasets to forecast US inflation. Despite the skepticism in the previous literature, we show that ML models with a large number of covariates are systematically more accurate than the benchmarks. The ML method that deserves more attention is the random forest model, which dominates all other models. Its good performance is due not only to its specific method of variable selection but also the potential nonlinearities between past key macroeconomic variables and inflation.
ResumenProyectar la inflación es una tarea importante pero difícil. Aquí, exploramos los avances de los métodos de machine learning (ML) y la disponibilidad de nuevas bases de datos para proyectar la inflación de EE.UU. A pesar del escepticismo en la literatura previa, demostramos que los modelos de ML con un amplio número de covariables son sistemáticamente más precisos que los modelos referenciales. El método de ML que merece más atención es el modelo random forest, el cual domina a todos los otros modelos. Su buen desempeño se debe no solo al método específico de selección de variables, sino que también a las potenciales no linealidades entre variables macroeconómicas clave y la inflación. We are very grateful to the coeditor, Christian B. Hansen; the associate editor; and two anonymous referees for very helpful comments. We thank Federico Bandi, Anders B. Kock and Michael Wolf for comments during the workshop "Trends in Econometrics: