-In this paper, Genetic Algorithms (GAs) are used for the protein structure prediction problem in a dynamic framework. The objective is to investigate if the changes on the fitness function during the evolution process of the GA are beneficial for the optimization process. Changing the fitness function during the evolutionary process can reduce the population's premature convergence problem, common on the search space for the protein structure prediction problem. A Calfa minimalist model is used to generate the dynamic fitness function for the GA. Tests with static and dynamic fitness functions are presented, and the results indicate an improvement on the RMSD when dynamic fitness functions are used.Keywords -Genetic Algorithms, Protein Structure Prediction, Dynamic Fitness Function, Protein
IntroduçãoProteínas, que são formadas por uma sequência de aminoácidos unidos por ligações covalentes, são moléculas constituintes de estruturas das células e responsáveis por diversas atividades biológicas [1]. A determinação da estrutura tridimensional das proteínas pode ser realizada experimentalmente, através de métodos de cristalografia de Raios-X e Ressonância Nuclear Magnética [2]. No entanto, esses métodos possuem algumas limitações, como alto custo e condições especiais para aplicação. De acordo com a hipótese de Afinsen [3], a Predição de Estruturas de Proteínas (PEP) pode, a princípio, ser realizada conhecendo-se apenas sua estrutura primária, ou seja, a seqüência de aminoácidos que forma sua cadeia. Esta determinação através de sistemas computacionais pode ser vista como um problema de otimização, no qual dada uma sequência de aminoácidos, deve-se determinar qual é a estrutura tridimensional da proteína, dentre as muitas estruturas possíveis, que minimiza uma função da energia potencial (função de fitness ou função de avaliação).A predição de estrutura de proteínas utilizando técnicas de aprendizado de máquina é um tema bastante abordado na literatura [4], [5], [6]. Algoritmos Genéticos (AGs), devido a suas características, como uso de populações de soluções e de operadores estocásticos, são interessantes para problemas complexos como a PEP. De fato, tem havido um crescente interesse por parte dos pesquisadores em aplicar tais algoritmos na determinação da estrutura tridimensional de proteínas. Entretanto, apesar de alguns resultados promissores, AGs apresentam dificuldades neste problema. Os motivos principais desta dificuldade são dois: primeiro, a existência de um número extremamente grande de soluções possíveis e de ótimos locais; segundo, a escolha de uma função de avaliação pertinente à tarefa de otimização da estrutura da proteína. Desta forma, diversas técnicas foram empregadas para tentar promover melhorias nos AGs utilizados no problema de PEP, como por exemplo: manutenção da diversidade da população [7]; inserção de conhecimento no AG [8]; uso de otimização multi-objetivo [9]; soluções híbridas de hill-climbing e AG [10] e remoção de gêmeos na população do AG [11].Este trabalho tem como princi...