ResumenLa Inteligencia Artificial orientada a la educación (AIEd) permite adecuar y/o adaptar los itinerarios del aprendizaje de un usuario mediante procesos inductivos basados en la extracción de datos obtenidos de las evidencias formativas que genera a lo largo de su vida escolar. El Big data, o datos masivos es el almacenamiento de grandes cantidades de datos que pueden ser analizados por diversos procedimientos y que permite encontrar patrones repetitivos o formulas predictivas que pueden generar un aprendizaje sobre nosotros mismos y sobre todo en la red. En el caso de los datos masivos que se generan a través de los exámenes utilizados en el aprendizaje y certificación de conocimiento de idiomas como segunda lengua a nivel nacional encontramos que podría ser útil aplicar las metodologías de procesamiento del Big Data para conocer mejor si la información generada a través de los test pueden mejorar o crear nuevas estrategias de aprendizaje o establecer criterios formales en el diseño de las pruebas, teorías de adquisición de se segunda lengua o incluso políticas educativas. La novedad de artículo se centra en establecer directrices viables para aplicar los conceptos más genéricos del Big Data en el contexto específico de los test de evaluación de idiomas como segunda lengua y donde existe a priori una gran cantidad de información a procesar a nivel educativo. El artículo muestra algunas directrices que podrían aplicarse en los mecanismos aplicados en la extracción de datos educativos del aprendizaje de idiomas a gran escala en el entorno específico de los test de evaluación de idiomas como lengua extranjera.Palabras clave: Datos Masivos, Inteligencia Artificial orientada a la educación, Minería de datos educativos, Aprendizaje a lo largo de la vida, Evaluación en el aprendizaje de segundas lenguas.
AbstractArtificial intelligence oriented to education (AIEd) allows the adequacy and / or adaption to the user's learning itineraries through inductive processes based on the extraction of data obtained from the formative evidences that it generates throughout its school life. Big data, or massive data, is the storage of large amounts of data that can be analyzed by various procedures and allows us to find repetitive patterns or predictive formulas that can generate learning about ourselves and especially the network. In the case of the massive data that are generated through the use of tests in the learning and certification of knowledge of languages as a foreign language at the national level, we find that it might be useful to apply Big Data's processing methodologies in order to know better if the information