2010
DOI: 10.1037/a0019507
|View full text |Cite
|
Sign up to set email alerts
|

A comprehensive review of effect size reporting and interpreting practices in academic journals in education and psychology.

Abstract: Null hypothesis significance testing has dominated quantitative research in education and psychology. However, the statistical significance of a test as indicated by a p-value does not speak to the practical significance of the study. Thus, reporting effect size to supplement p-value is highly recommended by scholars, journal editors, and academic associations. As a measure of practical significance, effect size quantifies the size of mean differences or strength of associations and directly answers the resear… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
1
1
1

Citation Types

0
163
1
22

Year Published

2011
2011
2023
2023

Publication Types

Select...
7
3

Relationship

0
10

Authors

Journals

citations
Cited by 253 publications
(186 citation statements)
references
References 111 publications
(266 reference statements)
0
163
1
22
Order By: Relevance
“…This may explain the reported discrepancies between p-values and effect sizes (Sun, Pan, & Wang, 2010). Indeed, lack of sufficient statistical power may yield less accurate estimates of effects and increase the likelihood of Type II errors (Abraham & Russell, 2008).…”
Section: Transcription and Early Text Production 30mentioning
confidence: 65%
“…This may explain the reported discrepancies between p-values and effect sizes (Sun, Pan, & Wang, 2010). Indeed, lack of sufficient statistical power may yield less accurate estimates of effects and increase the likelihood of Type II errors (Abraham & Russell, 2008).…”
Section: Transcription and Early Text Production 30mentioning
confidence: 65%
“…Aunque se han desarrollado muchos indicadores de magnitud del efecto (véanse revisiones recientes en Ellis, 2010y Grissom & Kim, 2012, se han destacado dos tipos básicos (Rosnow & Rosenthal, 2009): indicadores tipo d (que se basan en la diferencia de medias estandarizada) e indicadores tipo r (que se basan en la correlación y la proporción de varianza explicada). En ambos casos, la interpretación más usual emplea las etiquetas de Cohen (1988), "pequeño", "moderado" o "grande", pero esta práctica debería ser abandonada en favor de la utilización de intervalos de confianza y la evaluación de la discrepancia entre valores de p e indicadores de magnitud del efecto (véase Sun, Pan & Wang, 2010), además de intentar la comparación de indicadores que tratan un problema común dentro de un mismo estudio y entre diferentes estudios. En una reciente revisión, Peng, Chen, Chiang & Chiang (2013) valoran el notable incremento que se ha producido en la utilización de los indicadores de magnitud del efecto en años recientes, pero denuncian la subsistencia de algunas prácticas inadecuadas en informes de investigación tales como: (a) el uso de indicadores tipo r (R 2 y η 2 ) no ajustados, además de un casi nulo uso de otros indicadores menos sesgados como omega cuadrado (ω 2 ) y la correlación intraclase (véase Ivarsson, Andersen, Johnson & Lindwall, 2013), (b) el empleo de las "etiquetas" de Cohen (alto, moderado y bajo) sin ninguna contextualización ni interpretación, (c) la persistente falta de claridad en el uso de los indicadores eta cuadrado y eta cuadrado parcial, que coinciden en modelos ANOVA de un factor pero difieren en modelos ANOVA factoriales (véase Pierce, Block & Aguinis, 2004y Richardson, 2011, (d) el escaso uso de los intervalos de confianza tanto para los estimadores de las pruebas estadísticas como para los tamaños del efecto (véase Kelley & Preacher, 2012, Thompson, 2007, y (d) la falta de integración entre las pruebas de significación estadística y los indicadores de magnitud del efecto.…”
Section: Principios Básicos En El Proceso De Diseño Y Evaluación De Uunclassified
“…Como medida del tamaño del efecto se ha utilizado el coeficiente eta-cuadrado parcial (η p 2 ), ya que es uno de los procedimientos más utilizados habitualmente dentro de la investigación educativa (Sun, Pan y Wang, 2010). Para la interpretación de los tamaños del efecto se utiliza el criterio establecido en el trabajo clásico de Cohen (1988) …”
Section: Análisis De Datosunclassified