Uma das principais causas de perda de receita é a fraude. E com o crescente volume e armazenamento de dados várias empresas torna-se inviável a análise manual de todos os dados. O uso do KDD é (Knowledge Discovery in Database - Descoberta de conhecimento em base de dados) é um dos recursos no auxílio de gestão de grande quantidade de dados e transformá-los em informações. Este trabalho descreve uma das etapas do KDD, a mineração de dados, para extrair informações sobre índice de aprovação de exame de direção para obtenção da CNH, de uma base de dados real, para identificar possíveis casos de fraudes nesse exame. Foi utilizado detecção de outlier utilizando o boxplot e cluster com algoritmo k-means. Através dessas aplicações foi possível identificar os índices de aprovação atípicos e extrair informações sobre esses casos encontrados.
Este trabalho exibe uma estudo para integração entre a Biblioteca Digital Brasileira de Teses e Dissertações (BDTD), o Banco Teses e Dissertações da CAPES e a base nacional de currículos de pesquisadores (Plataforma Lattes). Ao todo foram analisados mais de 2 milhões de registros e foram adotados alguns procedimentos computacionais para coletar, normalizar e transformar os dados, além da aplicação de algoritmos de similaridade de strings para identificação de registros comuns entre as bases. Como resultado, observou-se que mais de 240 mil registros são estão na intersecção de BDTD e BTD CAPES, e que a Plataforma Lattes contém quase que a totalidade dos registros destas duas bases.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.