Proceedings of the Brazilian Symposium on Multimedia and the Web 2022
DOI: 10.1145/3539637.3557052
|View full text |Cite
|
Sign up to set email alerts
|

Evaluating Topic Modeling Pre-processing Pipelines for Portuguese Texts

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1

Citation Types

0
1
0
2

Year Published

2023
2023
2024
2024

Publication Types

Select...
3
1
1

Relationship

1
4

Authors

Journals

citations
Cited by 6 publications
(3 citation statements)
references
References 20 publications
0
1
0
2
Order By: Relevance
“…Não apresentamos as 24 matrizes de confusão por limitação de espaço e por serem bastante similares. Assim, é importante melhor analisar como os textos estão representados nas diferentes classes de forma que elas tenham uma melhor representatividade dos documentos de licitação, o que está de acordo com o resultado obtido por [Souza Júnior et al 2022].…”
Section: Resultados Experimentaisunclassified
See 1 more Smart Citation
“…Não apresentamos as 24 matrizes de confusão por limitação de espaço e por serem bastante similares. Assim, é importante melhor analisar como os textos estão representados nas diferentes classes de forma que elas tenham uma melhor representatividade dos documentos de licitação, o que está de acordo com o resultado obtido por [Souza Júnior et al 2022].…”
Section: Resultados Experimentaisunclassified
“…O artigo [Souza Júnior et al 2022] avaliou diferentes metodologias de préprocessamento na modelagem de tópicos para o português brasileiro. Foram aplicados três modelos de representação de documentos, incluindo duas novas propostas baseadas no modelo CluWords adaptadas para o português.…”
Section: Trabalhos Relacionadosunclassified
“…CluWords are clusters of semantically related word embeddings [Mikolov et al, 2018] built by employing distance functions 2 . CluWords have been successfully applied in the realm of topic modeling [Júnior et al, 2022] and hierarchical topic modeling scenarios [Viegas et al, 2020b[Viegas et al, , 2019. One of our main contributions to this article is demonstrating how to adapt and extend the Cluwords concept for specific applications through dataset-oriented and task-oriented filtering and weighting mechanisms.…”
Section: Related Workmentioning
confidence: 99%