Recebido em 7/4/00; aceito em 15/12/00 PROPOSITION, VALIDATION AND ANALYSIS OF QSAR MODELS. The present paper aims to bring under discussion some theoretical and practical aspects about the proposition, validation and analysis of QSAR models based on multiple linear regression. A comprehensive approach for the derivation of extrathermodynamic equations is reviewed. Some examples of QSAR models published in the literature are analyzed and criticized.Keywords: quantitative structure-activity relationships; multiple linear regression; validation of QSAR models. Quim. Nova, Vol. 24, No. 5, 658-671, 2001.
Divulgação
INTRODUÇÃOEm sua sétima edição do ano de 1973, o Journal of Medicinal Chemistry publicou um artigo de autoria de Unger e Hansch 1 que é considerado por muitos como um marco no desenvolvimento de QSAR, abreviação em inglês para Relações Quantitativas entre Estrutura e Atividade. O artigo tornou-se célebre por estabelecer regras gerais para a elaboração e validação dos modelos matemáticos que correlacionam estrutura química e atividade biológica. A publicação desse artigo foi conseqüência da publicação anterior de dois outros artigos, em que seus autores apresentaram modelos matemáticos distintos para analisar a atividade biológica da mesma série de compostos.Tudo começou com o artigo de Hansch e Lien 2 , em que se analisou a atividade antiadrenérgica de vinte e dois compostos derivados da N,N-dimetil-α-bromo-feniletilamina (1), substituídos nas posições meta e para do anel fenila, cujos valores haviam sido determinados cinco anos antes 3 .desvio-padrão do modelo. Neste ponto cabe um esclarecimento. Optou-se por apresentar as equações citadas em sua forma original. Assim que o formato apropriado de apresentação dos modelos matemáticos de QSAR for mostrado (ver adiante), o leitor poderá comparar as diversas formas de apresentação já utilizadas ao longo do tempo. Em 1972, Cammarata 6 apresentou a eq 2 como alternativa para a representação da atividade dos compostos derivados da estrutura 1. Na eq 2, π m e σ m são as constantes lipofílica e eletrônica dos grupos químicos presentes na posição meta do anel fenila da estrutura 1 (X), r v p é o raio de van der Waals do substituinte na posição para (Y) e os números entre parênteses correspondem aos desvios-padrão dos coeficientes da equação.Os valores numéricos de R e s na eq 2 indicam que o modelo de Cammarata consegue explicar maior quantidade da variabilidade dos valores da atividade biológica do que o modelo representado pela eq 1. No entanto, deve-se levar em consideração que o segundo membro da eq 2 contém uma variável a mais do que a eq 1, o que certamente contribui para sua melhor qualidade.Em 1973, Unger e Hansch 1 reagiram ao modelo proposto por Cammarata, afirmando que o mesmo continha inconsistên-cias relativas às variáveis utilizadas para descrever a atividade biológica e de forma alguma apresentava embasamento bioquí-mico, o que o invalidava. Alguns dos argumentos citados foram: (a) o modelo não atribui efeito hidrofóbico aos substituintes presentes n...