La demande croissante pour des évaluations à grande échelle s’accompagne d’une forte pression pour rendre ces évaluations plus informatives sur l’apprentissage des élèves. Or, ces évaluations fournissent les résultats des élèves sous forme de scores globaux et de sous-scores, ce qui renseigne peu sur leurs forces et faiblesses. Par ailleurs, les recherches en approche diagnostique cognitive suggèrent qu’il est possible de décomposer la lecture en connaissances et habiletés possibles à diagnostiquer grâce à des modélisations psychométriques. Des épreuves à grande échelle ont donc le potentiel de fournir aux enseignants des rapports diagnostiques contenant des rétroactions détaillées sur les forces et les faiblesses des élèves. Cet article décrit l'élaboration de rapports diagnostiques à partir des données du PIRLS 2011 avec un panel d'experts et rapporte les résultats de l’évaluation de ces rapports auprès d’enseignants au primaire, de conseillers pédagogiques et d’orthopédagogues.