Em primeiro lugar agradeço a Deus. Agradeço especialmente aos meus familiares: minha esposa Leiliane, por estar ao meu lado durante o mestrado, demonstrando apoio e paciência em todos os momentos; minha mãe Regina, por ensinar desde cedo a importância dos estudos; minha irmã Paula, pelas experiências que me transmitiu, vivenciadas durante sua trajetória acadêmica; e meu pai Paulo e meu irmão Daniel, por se fazerem sempre presentes em meu coração. Agradeço ao meu orientador prof. Dr. Li Weigang por acreditar em mim e me acompanhar nesses dois anos de mestrado. E finalmente, agradeço aos demais professores e funcionários do programa de pósgraduação em Informática da Universidade de Brasília. vi Resumo Ligação de Entidades (LE) é um importante tópico de pesquisa com diversas aplicações web. Apesar do crescente interesse o foco ainda tem sido a identificação de nomes próprios, isto é, pessoas, organizações, lugares, unidades de medida, etc. O principal desafio aqui é encontrar conceitos concretos (sentenças sem classe de entidade pré-definida) em textos da web conectando-os às respectivas páginas da Wikipédia. Este trabalho apresenta uma nova abordagem para ligar conceitos concretos obtidos de textos em Inglês com entidades Wiki, neste trabalho representadas por páginas da Wikipédia, utilizando classificação gramatical (part-of-speech) para detectar conceitos concretos e Modelos de Espaço Vetorial (MEV) para realizar a desambiguação das entidades Wiki selecionadas da base. A solução, denominada UnBWiki VSM, foi implementada em Java, por meio da IDE Eclipse, com banco de dados MySQL onde a base de entidades foi armazenada. O framework proposto foi ajustado para trabalhar com uma base de Wikilinks, referências para páginas da Wikipédia extraídas de diferentes páginas da web, contendo por volta de 2,8 milhões de entidades e 18 milhões de palavras, e obteve recall 34,2% superior ao obtido pela metodologia existente que utilizou os mesmos dados/entidades. Como estudo de caso, textos sobre a História da Família Real Britânica extraídos da web foram analisados manualmente, e o recall de 73,5% obtido pela ferramenta UnBWiki VSM foi ainda maior do que o verificado na comparação com o estado da arte.