Sistemas de recuperação de imagens por conteúdo (Content-based image retrieval-CBIR) e de classificação dependem fortemente de vetores de características que são extraídos das imagens considerando critérios visuais específicos.É comum que o tamanho dos vetores de características seja da ordem de centenas de elementos. Conforme se aumenta o tamanho (dimensionalidade) do vetor de características, também se aumentam os graus de irrelevâncias e redundâncias, levando ao problema da "maldição da dimensionalidade". Desse modo, a seleção das características relevantesé um passo primordial para o bom funcionamento de sistemas CBIR e de classificação. Nesta tese são apresentados novos métodos de seleção de características baseados em algoritmos genéticos (do inglês genetic algorithms-GA), visando o aprimoramento de consultas por similaridade e modelos de classificação. A família Fc ("Fitness coach") de funções de avaliação proposta vale-se de funções de avaliação de ranking, para desenvolver uma nova abordagem de seleção de características baseada em GA que visa aprimorar a acurácia de sistemas CBIR. A habilidade de busca de GA considerando os critérios de avaliação propostos (família Fc) trouxe uma melhora de precisão de consultas por similaridade de até 22% quando comparado com métodos wrapper tradicionais para seleção de características baseados em decision-trees (C4.5), naive bayes, support vector machine, 1-nearest neighbor e mineração de regras de associação. Outras contribuições desta tese são dois métodos de seleção de características baseados em filtragem, com aplicações em classificação de imagens, que utilizam o cálculo supervisionado da estatística de silhueta simplificada como função de avaliação: o silhouette-based greedy search (SiGS) e o silhouette-based genetic algorithm search (SiGAS). Os métodos propostos superaram os métodos concorrentes na literatura (CFS, FCBF, ReliefF, entre outros).É importante também ressaltar que o ganho em acurácia obtido pela família Fc, e pelos métodos SiGS e SiGAS propostos proporcionam também um decréscimo significativo no tamanho do vetor de características, de até 90%.
Precision-Recall is one of the main metrics for evaluating content-based image retrieval techniques. However, it does not provide an ample perception of the properties of an image dataset immersed in a metric space. In this work, we describe an alternative metric named H-Metric, which is determined along a sequence of controlled modifications in the image dataset. The process is named homogenization and works by altering the homogeneity characteristics of the classes of the images. The result is a process that measures how hard it is to deal with a set of images in respect to content-based retrieval, offering support in the task of analyzing configurations of distance functions and of features extractors.
A soja se tornou a principal cultura do agronegócio brasileiro, provocando impactos sociais e econômicos significativos em diversas regiões do país, apresentando uma evolução de 75,3 milhões de toneladas produzidas na safra 2010/2011 para 124,8 milhões de toneladas na safra de 2019/2020. Com base em estudos dos últimos anos, diversas tecnologias foram aplicadas na tentativa´ de realizar a detecção de doenças nessa cultura utilizando como base imagens˜ de suas folhas. Dentre as técnicas utilizadas pode-se citar o uso dos classificadores Support Vector Machines (SVMs) e K-Nearest Neighbours em conjunto com técnicas tradicionais de extração de características de imagens. Esse estudo aborda esse desafio utilizando Redes Neurais Convolucionais, uma técnica que tem como base o aprendizado profundo. Com este foco, foram experimentadas cinco arquiteturas de redes convolucionais (VGG16, ResNet50, DenseNet121, InceptionV3 e EfficientNetB7) e quatro diferentes otimizadores (SGD, Adam, RMSProp e Adadelta). Essas combinações foram treinadas usando transferência de aprendizado e ajuste fino de toda a arquitetura em questão. Ao final dos experimentos foi poss´ıvel analisar que arquitetura ResNet50 se destacou entre as demais, apresentando resultados significativos, além de apresentar a maior acurácia, dentre todos os modelos, atingindo o valor de 98.09%.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.