Resumo-Redes Sociais online, como por exemplo o Twitter, são amplamente utilizadas pelos seus usuários para expressar opiniões sobre questões que os cercam diariamente. Por meio da aplicação de algoritmos de classificaçãoé possível a identificação de padrões capazes de categorizar as mensagens oriundas de mídias sociais sob diversos pontos de vista. Os classificadores WiSARD podem ser utilizados para classificação de documentos textuais no modelo bag-of-words. O presente trabalho visa comparar a aplicação do classificador WiSARD com outros classificadores amplamente utilizados na mineração de opinião no contexto de documentos textuais oriundos de mídias sociais online. O classificador WiSARD apresentou acurácia próxima a do SVM e superior a do Naive Bayes nos dois datasets de teste utilizados.Palavras-chave-Opinion Mining, WiSARD, Weightless Neural Networks, Support Vector Machines, Naive Bayes, Bag of Words.
I. INTRODUÇÃORedes sociais online tornaram-se uma importante ferramenta de comunicação para a sociedade. Por meio dessas mídias, usuários compartilham suas opiniões sobre diversos assuntos. Para ilustrar a relevância do conteúdo publicado nas redes sociais online, a revista The New York Times apresentou um artigo destacando a importância dessas redes durante as eleicões presidenciais nos Estados Unidos em 2012 [1]. Outra importante utilização das mídias sociais está relacionada ao marketing digital, onde redes sociais online aproximaram empresas e consumidores. O company branding e o wordof-mouth advertising foram destacados pela Forbes como principais benefícios das mídias sociais em uma pesquisa de tendências para o ano de 2014 [2]."O que as pessoas pensam"é uma importante informação, para a maioria das pessoas, durante um processo de tomada de decisão [3], e a mineração de opinião tem como objetivo responder essa questão apoiada em técnicas de aprendizado de máquina. Tratando-se de documentos textuais oriundos de redes sociais online, tais técnicas tem como objetivo encontrar padrões nesses documentos e categorizá-los automaticamente sob um determinado ponto de vista. Existem diversas abordagens para extrair padrões de dados. Dentre as abordagens supervisionadas mais utilizadas no cenário de mídias sociais online, estão o Support Vector Machine (SVM) e o Naive Bayes.Devidoà disponibilidade do seu conteúdo, o Twitteré uma das redes sociais online mais estudadas. Muitos desses estudos visam identificar padrões de mensagens compartilhadas na rede com objetivo de classificá-las automaticamente. Por exemplo, o Twitter foi utilizado como fonte de dados para analisar a opinião pública a respeito das manifestações ocorridas em junho de 2013 no Brasil [4]. Os tweets foram classificados automaticamente como apoiando ou repudiando as manifestações, e o classificador utilizado no trabalho foi o Naive Bayes. Outro trabalho apresenta como objetivo identificar o alinhamento político dos usuários do Twitter por meio da classificação das mensagens desses usuários. Para isso, foi utilizado o SVM para categorizar as mensag...