Abstract-We present a nature-inspired semi-supervised learning technique based on the flocking formation of certain living species like birds and fishes. Each data item is treated as an individual in the flock. Starting from random directions, each data item moves according to its surrounding items, by getting closer to them (but not too much close) and taking the same direction of motion. Labeled items play special roles, ensuring that data from different classes will belong to different, distant flocks. Experiments on both artificial and benchmark datasets were performed and show its classification accuracy. Despite the rich behavior, we argue that this technique has a subquadratic asymptotic time complexity, thus being feasible to be used on large datasets. In order to achieve such performance, a space-partitioning technique is introduced. We also argue that the richness behind this dynamic, self-organizing model is quite robust and may be used to do much more than simply propagating the labels from labeled to unlabeled data. It could be used to determine class overlapping, wrong labeling, etc.
AgradecimentosPrimeiramente, sou grato à minha família, por apoiar-me em todas as decisões que tomei na vida, e por compreender que, mesmo estando eu ausente durante longos períodos, tal ausência teve bons motivos, dentre eles, a concretização deste trabalho. Agradeço ao Prof. Dr. Zhao Liang, pela orientação, paciência e dedicação, mantendo-me na linha e, ao mesmo tempo, oferecendo-me a liberdade de tomar diversas decisões. Um equilíbrio perfeito: liberdade, mas com moderação. Agradeço a todos os demais professores, do ICMC-USP e de outras instituições, do mestrado e de outras épocas, que durante toda a minha vida ajudaram a formar a pessoa que sou hoje. Agradeço a todos os amigos, pelos momentos de descontração, afinal nem só de estudo e trabalho vive o homem. Prefiro não citar nomes para não correr o risco de esquecer alguém. Quem comigo esteve presente sabe o quanto foi importante. Agradeço à Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP) e à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), pelo apoio financeiro concedido, por meio de bolsa, que viabilizou do desenvolvimento deste trabalho de mestrado. E claro, agradeço à Deus, por manter o caminho livre para que eu pudesse realizar este trabalho, dando-me saúde e motivação, oferecendo-me oportunidades, colocando-me diante de pessoas fantásticas, livrando-me de eventos ruins que eu não pudesse superar, embora algumas noites mal dormidas tenham sido necessárias. Enfim, expresso minha gratidão a todas as pessoas que, direta ou indiretamente, contribuíram para mais esta etapa que agora estou completando.i ii ResumoO aprendizado de máquina consiste de conceitos e técnicas que permitem aos computadores melhorar seu desempenho com a experiência, ou, em outras palavras, "aprender" com dados. Um dos principais tópicos do aprendizado de máquina é o agrupamento de dados que, como o nome sugere, procura agrupar os dados de acordo com sua similaridade. Apesar de sua definição relativamente simples, o agrupamento é uma tarefa computacionalmente complexa, tornando proibitivo o emprego de algoritmos exaustivos, na busca pela solução ótima do problema. A importância do agrupamento de dados, aliada aos seus desafios, faz desse campo um ambiente de intensa pesquisa. Também a classe de fenô-menos naturais conhecida como comportamento coletivo tem despertado muito interesse. Isso decorre da observação de um estado organizado e global que surge espontaneamente das interações locais presentes em grandes grupos de indivíduos, caracterizando, pois, o que se chama auto-organização -ou "emergência", para ser mais preciso. Os desafios intrínsecos e a relevância do tema vêm motivando sua pesquisa em diversos ramos da ciência e da engenharia. Ao mesmo tempo, técnicas baseadas em comportamento coletivo vêm sendo empregadas em tarefas de aprendizado de máquina, mostrando-se promissoras e ganhando bastante atenção. No presente trabalho, objetivou-se o desenvolvimento de técnicas de agrupamento baseadas em comportamento coletivo. Faz-se cada item do conjunt...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.