2018
DOI: 10.5753/isys.2018.359
|View full text |Cite
|
Sign up to set email alerts
|

MDLText aplicado na Filtragem Automática de SPIM e SMS Spam

Abstract: A filtragem automática de spam em mensagens instantâneas e SMS é um problema desafiador, pois as mensagens são frequentemente curtas e repletas de ruídos, tais como gírias, expressões idiomáticas, símbolos, emoticons e abreviações, o que dificulta a extração de conhecimento e predição. Para enfrentar esse problema, neste artigo é avaliado um método de classificação de texto baseado no princípio da descrição mais simples, que é eficiente, rápido, escalável, multiclasse e possui aprendizado incremental. Experime… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Publication Types

Select...
1

Relationship

0
1

Authors

Journals

citations
Cited by 1 publication
(1 citation statement)
references
References 37 publications
(42 reference statements)
0
0
0
1
Order By: Relevance
“…A tarefa de traduzir variantes léxicas de palavras e expressões normalmente ofuscadas para sua forma canônica se chama normalização léxica. As variantes léxicas e expressões podem ser encontradas de diferentes formas, como a repetição de letras observada em "goood" que pode ser traduzida para "good"; abreviações como "b4", que significa "before"; siglas como "afk" que pode ser traduzida como "away from keyboard"; ou até mesmo reduzir as palavras para radicais, removendo termos muito semelhantes como plurais ou superlativos, tais como "stores" para "store" e "largest" para "large", respectivamente (SILVA et al, 2014).…”
Section: Normalizac ¸ãO Léxicaunclassified
“…A tarefa de traduzir variantes léxicas de palavras e expressões normalmente ofuscadas para sua forma canônica se chama normalização léxica. As variantes léxicas e expressões podem ser encontradas de diferentes formas, como a repetição de letras observada em "goood" que pode ser traduzida para "good"; abreviações como "b4", que significa "before"; siglas como "afk" que pode ser traduzida como "away from keyboard"; ou até mesmo reduzir as palavras para radicais, removendo termos muito semelhantes como plurais ou superlativos, tais como "stores" para "store" e "largest" para "large", respectivamente (SILVA et al, 2014).…”
Section: Normalizac ¸ãO Léxicaunclassified