O nosso principal objetivo e apresentar uma análise exploratória do desempenho e da viabilidade de três modelos de regras de associação existentes na literatura (CBA, CMAR, CPAR) no contexto de classificação de malwares Android. Além disso, desenvolvemos também um novo modelo de classificação baseado em regras de associação e qualidade de regras, denominado EQAR, que estende o algoritmo clássico ECLAT. Para fins de comparação dos quatro modelos, utilizamos três datasets frequentemente utilizados para o treino de modelos de detecção de malwares Android: DREBIN-215, KronoDroid Emulador e KronoDroid Dispositivo Real. Os resultados indicam que os métodos de classificação baseados em regras de associação apresentam bons resultados, entretanto, os metodos avaliados dificilmente conseguem atingir a estabilidade de métricas e os resultados numéricos alcançados por modelos de aprendizado de máquina, como RandomForest e SVM, no domínio de detecção de malwares Android.
Existem diferentes métodos de classificação baseados em regras de associação. Entretanto, é muitas vezes difícil de encontrar a implementação e realizar a avaliação dos métodos. Para mitigar esses problemas, propomos a AutoCAR, um arcabouço de software modular para catalogar implementações, automatizar os testes e a avaliação de métodos de classificação baseados em regras de associação. AutoCAR permite que novos métodos sejam incorporados à ferramenta sem a necessidade de modificação do código.
Atualmente, há dezenas de métodos sofisticados para a seleção de características de um dataset. Entretanto, é difícil encontrarmos a implementação para avaliar a qualidade dos métodos em conjuntos diversos de datasets. Como forma de apresentar uma primeira solução para esse problema, implementamos a FS3E, uma ferramenta para catalogar implementações e automatizar a avaliação de métodos sofisticados de seleção de características. Para demostrar a funcionalidade e utilidade da FS3E, implementamos e disponibilizamos também cinco métodos sofisticados de seleção de características para o domínio de detecção de malwares Android.
Neste trabalho apresentamos a DroidAutoML, uma ferramenta de AutoML especializada para o domínio de detecção de malwares Android. A partir de um dataset de entrada e um pipeline de dados de quatro estágios, a DroidAutoML possibilita a geração automática de modelos preditivos otimizados. Os resultados iniciais indicam que a ferramenta é capaz de gerar modelos muito bons, chegando a 95% de recall.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.