O uso de bots sociais com fins políticos tem se tornado uma preocupação cada vez mais relevante e tem levantado alertas sobre o impacto nas discussões democráticas. Este trabalho apresenta um estudo de caso sobre o uso de bots nas discussões políticas durante o período do segundo turno das eleições brasileiras de 2018, visando construir um modelo de detecção automática para bots e comparando o uso de algoritmos de inteligência artificial explicáveis e não-explicáveis. Primeiramente foi construído um conjunto de dados rotulando manualmente contas entre bots e humanos. Então foram aplicados algoritmos de regressão linear, árvores aleatórias, Bayesiano ingênuo, multilayer perceptron e random forest. Foi identificado que mesmo algoritmos mais simples e explicáveis como árvore aleatória têm um desempenho semelhante a algoritmos mais complexos como random forest. Utilizando apenas características do usuário, foi possível identificar mais de 46% dos bots, porém todos modelos apresentaram uma precisão não maior que 52% nessa tarefa.
Currently, there are thousands of social bots acting on different online social networks. Identifying them automatically is a computational challenge.This work uses different natural language processing methods to extract features from tweets collected during the 2018 Brazilian presidential election period in order to make the bot detection process more precise. The developed solution uses artificial intelligence techniques, combining feature selection and classification algorithms.The authors obtained the best results through a union of all the extracted features using the Random Forest classifier, achieving an precision of 0.86 for the bot class and AUC of 0.86.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.