Anais Estendidos Do XXII Simpósio Brasileiro De Segurança Da Informação E De Sistemas Computacionais (SBSeg Estendido 2022) 2022
DOI: 10.5753/sbseg_estendido.2022.227038
|View full text |Cite
|
Sign up to set email alerts
|

ADBuilder: uma Ferramenta de Construção de Datasets para Detecção de Malwares Android

Abstract: A maioria dos datasets existentes possuem um número limitado ou defasado de amostras, o que compromete o treinamento de modelos para detecção de malwares Android. Na literatura existem alguns trabalhos que propõem a construção de datasets, porém, nenhum deles suficientemente definido e integrado a ponto de entregar de forma automatizada e sistematizada um dataset ao usuário. Neste trabalho, propomos a ferramenta ADBuilder, que permite a construção integrada, automatizada e sistematizada de datasets atualizado… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
5

Citation Types

0
1
0
8

Year Published

2023
2023
2023
2023

Publication Types

Select...
5

Relationship

0
5

Authors

Journals

citations
Cited by 5 publications
(9 citation statements)
references
References 8 publications
0
1
0
8
Order By: Relevance
“…Estatísticas recentes apontam que cerca de 80% dos projetos de Inteligência Artificial (IA) enfrentam falhas devido à falta de dados quantitativos para treinamento e construção de modelos realistas e eficazes [AI & Data Today, 2023]. O cenário é similar no contexto da detecção de malwares Android, pois faltam conjuntos de dados suficientemente representativos e de qualidade [Vilanova et al, 2022].…”
Section: Introductionunclassified
See 1 more Smart Citation
“…Estatísticas recentes apontam que cerca de 80% dos projetos de Inteligência Artificial (IA) enfrentam falhas devido à falta de dados quantitativos para treinamento e construção de modelos realistas e eficazes [AI & Data Today, 2023]. O cenário é similar no contexto da detecção de malwares Android, pois faltam conjuntos de dados suficientemente representativos e de qualidade [Vilanova et al, 2022].…”
Section: Introductionunclassified
“…Este é possivelmente um dos principais fatores que leva a maioria das pesquisas a utilizar datasets pequenos, pouco representativos e defasados para treinar e validar modelos preditivos para detecção de malwares Android. Por exemplo, a API do VirusTotal 1 , o serviço de rotulação mais completo e frequentemente utilizado [Vilanova et al, 2022], na versão gratuita, permite aproximadamente 250 rotulações atualizadas por dia, ou seja, seriam necessários em torno de 400 dias para rotular adequadamente 100.000 amostras. Este processo longo e demorado leva ao problema adicional da defasagem dos dados.…”
Section: Introductionunclassified
“…A rotulação correta de amostras malignas e benignas é uma etapa crucial para a implementação e avaliação de novos métodos de detecção de malwares Android [Wei et al, 2017, Salem et al, 2021, Vilanova et al, 2022. Frequentemente, a plataforma online VirusTotal 1 é utilizada para categorizar aplicativos Android com base nos resultados de mais de 60 scanners antivírus.…”
Section: Introductionunclassified
“…O primeiro desafio é obter dados atualizados. Infelizmente, a maioria dos trabalhos, incluindo ferramentas recentes como a ADBuilder [Vilanova et al, 2022], simplesmente utilizam os dados retornados pelo VirusTotal. O problema é que o VirusTotal armazena em cache os dados da última análise do aplicativo.…”
Section: Introductionunclassified
See 1 more Smart Citation