RESUMOEsse artigo teórico apresenta e discute os conceitos de entropia e informação mútua da Teoria da Informação aplicados ao reconhecimento de padrões partindo, principalmente, das ideias de Shannon e Rényi. Tendo por base a diversidade de aplicação da teoria, como nas áreas de engenharia, estatística, economia e informática e a escassez de bibliografia em português, expõe-se uma maneira de utilizar a entropia aplicada à pesquisa, com uma aplicação mostrada para a construção de árvore de decisão. Também são debatidas similaridade e diferenças com o conceito físico de entropia. Palavras-chave: Teoria da Informação, Entropia de Shannon, Entropia de Rényi, Árvores de Decisão.
ABSTRACTThis paper presents and discusses the concepts of entropy and mutual information in Information Theory applied to pattern recognize, based mainly on the ideas of Shannon and Rényi. Based on the diversity of application of the theory, as in engineering, statistics, economics and informatics and the few literature in Portuguese, is exposed a way of using the entropy applied to the academic researches, with an application showed for the construction of decision tree. Are also discussed similarities and differences with the physical concept of entropy. Keywords: Information Theory, Shannon's Entropy, Rényi's Entropy, Decision Tree.
INTRODUÇÃOClaude E. Shannon (1948) foi um pioneiro ao considerar a comunicação como um problema matemático rigorosamente embasado na estatística, criando um ramo da teoria da probabilidade e da estatística chamado Teoria da Informação. Apesar de ser originalmente desenvolvida para informações perdidas na compressão e transmissão de mensagens com ruídos em um canal de comunicação, sua aplicabilidade se expandiu para outros domínios da engenharia, informática, estatística e economia.Entretanto, sua similaridade com o conceito físico de entropia e seu uso em áreas diversas das quais foi pensada pode ocasionar alguns equívocos teóricos e metodológicos. Soma-se a isso a escassa literatura existente em português, em especial sobre a entropia de Rényi. Por isso, apresenta-se um breve apanhado sobre a teoria da informação, partindo do conceito de Shannon e comparando-o com a grandeza física entropia. A seguir, mostra-se a generalização feita por Rényi e os desenvolvimentos até se obter os estimadores das medidas de entropia e informação mútua. Posteriormente, os conceitos básicos da Teoria da Informação são exemplificados numa aplicação de Árvores de Decisão com o objetivo de reconhecimento de padrões.