“…Studies demonstrated high levels of heterogeneity across tasks used to assess diagnostic discriminative ability, the type of technology used to implement them, primary metrics evaluated and developmental domains assessed. Tasks were presented on portable technologies, such as laptops ( H. Li & Leung, 2020 ; Lu et al, 2019 ), tablet computers ( Anzulewicz et al, 2016 ; Bovery et al, 2021 ; Campbell et al, 2019 ; Carlsson et al, 2018 ; Carpenter et al, 2021 ; Chen et al, 2019 ; Chetcuti et al, 2019 ; Dawson et al, 2018 ; Fleury et al, 2013 ; Gale et al, 2019 ; Jones et al, 2018 ; Mahmoudi-Nejad et al, 2017 ; Ruta et al, 2017 ), smartphones ( Mahmoudi-Nejad et al, 2017 ; Rafique et al, 2019 ; Zhao & Lu, 2020 ), intelligent toys ( Moradi et al, 2017 ) and digital audio recorders ( Nakai et al, 2014 ; Wijesinghe et al, 2019 ), and non-portable technologies, such as desktop computers ( Aresti-Bartolome et al, 2015 ; Borsos & Gyori, 2017 ; Chaminade et al, 2015 ; Crippa et al, 2013 ; Deschamps et al, 2014 ; Dowd et al, 2012 ; Gardiner et al, 2017 ; Gyori et al, 2018 ; Hetzroni et al, 2019 ; J. Li et al, 2020 ; P. Li et al, 2016 ; Lin et al, 2013 ; Martin et al, 2018 ; Veenstra et al, 2012 ) and VR platforms of varying sophistication ( Jung et al, 2006 ; Jyoti & Lahiri, 2020 ; Alcañiz Raya et al, 2020 ;…”