Un aspecto fundamental en la evaluación de aprendizajes es la validez de los resultados de la prueba utilizada, que no solo supone medir lo que se dice sino considerar las implicaciones de esos resultados, porque a partir de ellos se toman variadas decisiones. La existencia de funcionamiento diferencial del ítem (DIF) indica que sujetos que tienen igual grado de habilidad presentan diferente probabilidad de responder correctamente a un ítem, lo que se relaciona con el sesgo, es decir, favorecer a un grupo sobre otro en la evaluación. En los últimos años, la integración y el aprendizaje de los alumnos con necesidades educativas especiales transitorias (NEET) han sido el foco de políticas educacionales especiales que involucran recursos, especialistas y nuevas formas de trabajar en las escuelas de Chile. Mediante un enfoque metodológico secuencial cuantitativo se exploró el funcionamiento diferencial del ítem de una prueba estandarizada aplicada por un centro de medición en educación (MIDE UC) a más de 100 establecimientos en Chile en las áreas de lenguaje y matemática en los niveles desde 4° a 8° Básico para niños con y sin NEET. Un primer análisis cuantitativo exploró el funcionamiento diferencial del ítem (DIF) obteniéndose similitudes en la habilidad promedio de los grupos y pocos ítems con DIF significativo (menos del 10%). Posteriormente, se exploró la forma en que los colegios operacionalizan la variable integración, observándose que el grupo de niños sin NEET usado en el análisis estadístico puede haber sido, en realidad, un grupo híbrido que incluía a algunos niños con NEET.Palabras clave: Evaluación, Sesgo, Funcionamiento diferencial del ítem (DIF), Sesgo estadístico, Integración educativa, Validez, Necesidades educativas especiales transitorias (NEET).An important aspect of learning assessment is the validity of the results of the test used because they are the basis for social, political or institutional decisions. The existence of differential item functioning (DIF) indicates that subjects having presented the same degree of skill, have different probability of correctly respond to an item, which strongly affect an aspect of the validity of the test, which relates to the bias, i.e. favor one group over another in the evaluation. In recent years, integration and learning of students with temporary special educational needs (NEET) have been the focus of special education policies involving resources, specialists and new ways of working in schools in Chile. Using a sequential quantitative methodological approach we explored the differential item functioning, aspect of the validity of the results, of a standardized test administered by measurement center (MIDE UC) to more than 100 schools in Chile in language and mathematics from 4th to 8th grade to children with and without NEET. An initial analysis of differential item functioning (DIF) showed similarities in the average group ability and few items with significant DIF (less than 10%). Later, we explored how schools operationalize the variable depicting...