Resumo -O objetivo deste trabalho foi integrar dados de caracteres quantitativos, multicategóricos, moleculares e fitopatológicos para a avaliação da diversidade genética de subamostras de tomateiro do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH-UFV). Foram utilizados dados de 67 subamostras de tomateiro do BGH-UFV, caracterizadas quanto a 19 caracteres quantitativos, 30 multicategóricos, 52 locos ISSR e à reação a três patógenos (Alternaria solani, Pseudomonas syringae pv. tomato e Tomato yellow spot virus). Inicialmente, a avaliação da diversidade entre as subamostras foi realizada para cada conjunto de caracteres individualmente, e indicou que a diversidade baseada em qualquer um dos conjuntos de dados não reflete a diversidade dos demais. Para a integração dos dados, codificaram-se os de natureza quantitativa em multicategóricos, por meio de cinco estratégias diferentes. A estratégia de divisão equitativa da amplitude dos dados em três classes foi a mais indicada, com correlação de 0,78 entre as matrizes de dissimilaridade dos dados codificados e originais. A análise de diversidade genética a partir da integração dos dados resultou em grupos com maior correspondência às origens das subamostras de tomateiro avaliadas, o que indica que a integração de dados de diferentes naturezas pode ser realizada com êxito pela conversão dos dados quantitativos em multicategóricos.Termos para indexação: Lycopersicon esculentum, banco de germoplasma, codificação de dados, correlação entre matrizes, método de Tocher.
Integration of data in studies of genetic diversity of tomatoAbstract -The objective of this work was to integrate data from quantitative, multicategorical, molecular and phytopathological traits in order to evaluate the genetic diversity of tomato subsamples from the germplasm bank of the Universidade Federal de Viçosa (BGH-UFV). Data from 67 tomato subsamples from BGH-UFV were used, characterized according to 19 quantitative traits, 30 multicategoric characters, 52 ISSR loci, and to the reaction to three diseases (Alternaria solani, Pseudomonas syringae pv. tomato and Tomato yellow spot virus). Initially, the diversity assessment between the subsamples was performed for each set of characters, indicating that diversity based on any one set of data does not reflect the diversity of another set. For the integration of data, the quantitative ones were coded as multicategoric, by five different strategies. The coding strategy with equitable division of the range of data in three classes was the most appropriate, with correlation of 0.78 between the dissimilarity matrices of encoded and original data. The analysis of genetic diversity by the integration of data resulted in groups with higher correspondence to the origins of the subsamples of tomato, indicating that the integration of data from different sources can be successfully carried out by the conversion of quantitative data in multicategoric.