Nos últimos anos, a perda de safras de arroz vem aumentando devido a estresses bióticos e abióticos, dentre os quais se destaca a brusone, que pode resultar em perdas de 100% em cultivares de arroz susceptíveis. Portanto, torna-se estratégico identificar metodologias que selecionem cultivares mais resistentes à doença. Neste trabalho, objetivou-se utilizar a análise de curva ROC (Receiver operator characteristic) e medidas tradicionais para a avaliação do desempenho de modelos de estimação genômicos (RR-BLUP, BLASSO e Bayes Cπ) na identificação da resistência do arroz à brusone. Os modelos RR-BLUP e Bayes Cπ foram mais acurados para a predição de resistência à brusone, enquanto o menor tempo de execução foi obtido pelo RR-BLUP. A área abaixo da curva ROC foi equivalente às medidas tradicionais para avaliar a acurácia dos modelos, com a vantagem de permitir a avaliação gráfica. Pela análise gráfica, o BLASSO obteve menor desempenho em altos níveis de especificidade (>0,75). Em menores níveis de especificidade, a sensibilidade dos modelos foi similar. A metodologia ROC mostrou-se uma boa alternativa para avaliação de modelos de predição genômica, podendo ser utilizada para a seleção de cultivares de arroz resistentes à brusone. Palavras-chave: brusone do arroz; modelagem estatística; seleção genômica ampla; análise ROC; acurácia. Performance of genomic estimation methods in the identification of rice resistance to brusone ABSTRACT: In recent years, rice crop losses have increased due to biotic and abiotic stresses, among which brusone, which can result in 100% losses in susceptible rice cultivars. Therefore, it becomes strategic to identify methodologies that select resistant cultivars. In this work, we aimed to use ROC (Receiver operator characteristic) curve analysis and traditional measures to evaluate the performance of genomic estimation models (RR-BLUP, BLASSO and Bayes Cπ) in identifying rice resistance to brusone. The RR-BLUP and Bayes Cπ models were most accurate for the prediction of brusone resistance, while the best runtime was obtained by RR-BLUP. The area under the ROC curve was equivalent to traditional measures to evaluate the accuracy of the models, with the advantage of allowing graphical evaluation. By graphical analysis, BLASSO performed worst at high levels of specificity (>0.75). At lower levels of specificity, the sensitivity of the models was similar. The ROC methodology proved to be a good alternative for the evaluation of genomic prediction models, and can be used for the selection of rice cultivars resistant to brusone. Keywords: rice blast; statistical modelling; genomics wide selection; ROC analysis; accuracy.
Este trabalho teve como objetivo principal estudar e comparar os diferentes ajustes de Modelos Lineares Generalizados Hierárquicos Mistos (HGLMM), em função das diferentes classes de variáveis aleatórias (contínuas e categóricas) e de estrutura de modelos. Estudar a flexibilização proporcionada pelos HGLMM frente aos comumente utilizados Modelos Lineares Mistos (LMM) e Modelos Lineares Generalizados Mistos (GLMM). Por vez, o HGLMM é uma classe de modelos mais ampla (a qual abarca todas as demais, via convergência, e, portanto, é a melhor modelagem que pode ser feita para qualquer classe de variáveis aleatórias) que engloba a inferência bayesiana e a inferência fisheriana (verossimilhancista) por meio da utilização da Verossimilhança Hierárquica. Nessa classe é possível ter como casos particulares de ajustes tanto o Modelo Linear Misto como o Modelo Linear Misto Generalizado. A maior vantagem do HGLMM é a possibilidade de atribuir outras distribuições (além daquela atribuída aos efeitos dos erros) da família exponencial aos fatores de componentes aleatórios do modelo e, assim, flexibilizar o ajuste em diferentes variáveis, modelos e bancos de dados. Para esse estudo foram utilizados três bancos de dados reais que possuíam características de diferentes naturezas como a contínua e categórica. Os ajustes foram comparados pelos valores do Conditional Akaike Information Criterion – cAIC (seleção de modelos) e da herdabilidade (via a maximização da acurácia). A herdabilidade foi utilizada para comparar as capacidades das estimativas dos componentes de variância capturarem adequadamente a variação genética e, portanto, propiciarem elevadas acurácias seletivas. Pode-se observar que o HGLMM alternativo teve o melhor ajuste em vários cenários. Para características contínuas foi competitivo com o Modelo Linear Misto na estimativa de componentes de variância e em ajuste de acordo com os valores cAIC. Para características categóricas se sobressaiu ao GLMM em diversos cenários. Conclui-se que os HGLMM podem ser usados corriqueiramente na análise estatística, em geral, propiciando uma triagem eficiente de quais modelos usar na modelagem de cada uma das várias classes de variáveis aleatórias, quais sejam contínuas ou categóricas. Palavras-chave: Modelos Lineares Generalizados. Modelos Hierárquicos. Seleção de Modelos. Inferência Estatística. Verossimilhança Hierárquica. Quadrados mínimos iterativos ponderados.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.