Popular mobile applications receive millions of user reviews. Thesereviews contain relevant information, such as problem reports and improvementsuggestions. The reviews information is a valuable knowledge source for soft-ware requirements engineering since the analysis of the reviews feedback helpsto make strategic decisions in order to improve the app quality. However, due tothe large volume of texts, the manual extraction of the relevant information is animpracticable task. In this paper, we investigate and compare textual represen-tation models for app reviews classification. We discuss different aspects andapproaches for the reviews representation, analyzing from the classic Bag-of-Words models to the most recent state-of-the-art Pre-trained Neural Languagemodels. Our findings show that the classic Bag-of-Words model, combined witha careful analysis of text pre-processing techniques, is still a competitive model.However, pre-trained neural language models showed to be more advantageoussince it obtains good classification performance, provides significant dimension-ality reduction, and deals more adequately with semantic proximity between thereviews’ texts, especially the multilingual neural language models.
Dado o volume massivo de textos sendo produzido nos dias atuais, a classificação automática de textos tem se tornado interessante tanto para fins acadêmicos quanto empresariais. Tradicionalmente, a classificação automática de textos é realizada por meio de aprendizado de máquina multi-classe, o qual requer que o usuário apresente textos rotulados de todas as classes de um domínio. Entretanto, em cenários onde deseja-se classificar apenas se um documento pertence ou não a uma classe de interesse, é mais adequada a utilização do aprendizado baseado em uma única classe (AMUC), o qual requer apenas textos rotulados da classe de interesse para se gerar um modelo de classificação. Apesar da aplicabilidade do AMUC, não há trabalhos na literatura que considerem avaliações experimentais envolvendo algoritmos de diferentes categorias, diferentes técnicas de pré-processamento de textos, e diferentes coleções de textos, de forma a indicar quais são as técnicas e algoritmos a serem utilizados em determinadas situações. Com isso, esse artigo visa sanar essa lacuna. Nos resultados é demonstrado que o algoritmo de AMUC baseado no k-Means obteve as melhores performances de classificação para a maioria dos experimentos realizados. Além disso, o uso de técnicas de redução de dimensionalidade, as quais são comumente empregadas na literatura, não proveram aumento na performance de classificação.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.