T铆tulo: Una investigaci贸n de la mejora de la capacidad de evaluaci贸n mediante el uso de un modelo logit anidado para items de elecci贸n m煤ltiple. Resumen: Los items de elecci贸n m煤ltiple se han usado ampliamente en tests psicol贸gicos y educativos. Este estudio investiga si los items de elecci贸n m煤ltiple tiene ventajas sobre los items dicot贸micos o sobre la evaluaci贸n de rasgo latente. Un modelo de respuesta al item, con un modelo logit anidado, log铆stico 2-par谩metros (2PL-NKM), fue usado para ajustar los datos de elecci贸n m煤ltiple. Los estudios de simulaci贸n y emp铆ricos indicaron que la precisi贸n y la estabilidad de la estimaci贸n de capacidad mejor贸 usando el modelo de elecci贸n m煤ltiple en contraposici贸n al modelo dicot贸mico, debido a la mayor informaci贸n incluida en los items distractores de la elecci贸n m煤ltiple. Pero la precisi贸n y la capacidad de estimaci贸n mostr贸 peque帽as diferencias en items de cuatro elecciones, cinco y seis elecciones. Adem谩s, el modelo 2PL-NLM puede extraer m谩s informaci贸n respondientes de bajo nivel que de los de alto nivel, debido a que tienen conductas de elecci贸n con m谩s distractores. En el estudio emp铆rico, los respondientes en diferentes niveles de rasgo fueron atra铆dos por diferentes distractrores del Test de Vocabulario chino en el primer grado, usando trazos cambiantes en la probabilidad de distractor a partir de 2PL-NLM. Esto sugiere que las respuestas de los estudiantes a diferentes niveles puede reflejar un proceso evolutivo de vocabulario en los estudiantes. Palabras clave: items de elecci贸n m煤ltiple; modelo logit anidado; informaci贸n distractora; capacidad de evaluaci贸n.Abstract. Multiple-choice items are wildly used in psychological and educational test. The present study investigated that if a multiple-choice item have an advantage over a dichotomous item on ability or latent trait evaluation. An item response model, 2-parameter logistic nested logit model (2PL-NLM), was used to fit the multiple-choice data. Both simulation study and empirical study indicated that the accuracy and the stability of ability estimation were enhanced by using multiple-choice model rather than dichotomous model, because more information was included in multiple-choice items' distractors. But the accuracy of ability estimation showed little differences in four-choice items, five-choice items and sixchoice items. Moreover, 2PL-NLM could extract more information from low-level respondents than from high-level ones, because they had more distractor chosen behaviors. In the empirical study, respondents at different trait levels would be attracted by different distractors from the Chinese Vocabulary Test for Grade 1 by using the changing traces of distractor probabilities calculated from 2PL-NLM. It is suggested that the responses of students at different levels could reflect the students' vocabulary development process.