“…Model penskor esai otomatis umumnya divalidasi dengan cara membandingkan kesamaan hasil penskorannya dengan hasil penskoran manusia untuk data yang sama (Attali & Burstein, 2006;Chung & Baker, 2003;Graham, dkk,, 2012;Williamson, dkk., 2010). Rater atau penskor manusia dianggap sebagai standar untuk penskoran yang akan dilakukan lebih luas oleh penskor otomatis, artinya hasil perbandingan kesamaan menjadi penentu kualitas penskor otomatis (Powers, dkk., 2015;Shermi,s dkk., 2010;Toranj & Ansari, 2012;Wahlen, dkk., 2020;Williamson, dkk., 2010;Zhang, 2013). Korelasi antara program penskoran esai otomatis dan penilai manusia akan bervariasi tergantung pada kalibrasi yang dilakukan, sampel yang digunakan untuk menghitung korelasi, atau validasi silang yang digunakan (Keith, 2003).…”