Products derived from corn and soy are consumed on a large scale in the world. Market price fluctuations have far-reaching effects on grain consumers, criteria and indices. Thus, the forecast of future grain and grain prices has attracted the attention of investments and agribusiness companies. Estimation, forecasting models use time series to predict future values. However, external factors can originate the data in time series, such as political events, improvement patterns and the foreign exchange market. This information is not explicit in time series data and can make it difficult to predict variable values. Textual data extracted from news, forums and social media can be a source of knowledge about external factors and potentially useful for weather forecasting models. Some studies present text mining techniques to combine textual data with time series. However, existing representations have limitations, such as the curse of dimensionality and ineffective attributes. In this sense, this work proposes representations of time series enriched with textual information. The results indicate that the methods used can be an alternative to improve the prediction performance in regression tasks. Resumo: Os produtos derivados do milho e da soja são consumidos em grande escala no mundo. As flutuações dos preços no mercado têm efeitos de longo alcance sobre os consumidores, agricultores e processadores de grãos. Assim, a previsão de preços futuros desses grãos tem atraído significativa atenção dos pesquisadores e empresas do agronegócio. Geralmente, os modelos de previsão usam séries temporais para predizer valores futuros. No entanto, fatores externos podem influenciar os dados em séries temporais, como eventos políticos, crises econômicas e o mercado de câmbio. Essas informações não são explícitas nos dados da série temporal e podem dificultar a previsão dos valores das variáveis. Os dados textuais extraídos de notícias, fóruns e redes sociais podem ser uma fonte de conhecimento sobre fatores externos e potencialmente úteis para modelos de previsão de séries temporais. Alguns estudos apresentam técnicas de mineração de texto para combinar dados textuais com séries temporais. No entanto, as representações existentes apresentam algumas limitações, como a maldição da dimensionalidade e atributos ineficazes. Nesse sentido, este trabalho propõem representações de séries temporais enriquecidas com informações textuais. Os resultados indicam que os métodos utilizados podem ser uma alternativa para melhorar o desempenho de previsão em tarefas de regressão.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.