2022
DOI: 10.5753/jidm.2022.2340
|View full text |Cite
|
Sign up to set email alerts
|

Essay-BR: a Brazilian Corpus to Automatic Essay Scoring Task

Abstract: Automatic Essay Scoring (AES) is the computer technology that evaluates and scores the written essays, aiming to provide computational models to grade essays automatically or with minimal human involvement. While there are several AES studies in a variety of languages, few of them are focused on the Portuguese language. The main reason is the lack of a corpus with manually graded essays. In order to bridge this gap, in this paper we extended a corpus of essays written by Brazilian high school students in an on… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2
1

Citation Types

0
0
0
1

Year Published

2022
2022
2024
2024

Publication Types

Select...
3
2
1

Relationship

0
6

Authors

Journals

citations
Cited by 8 publications
(5 citation statements)
references
References 18 publications
0
0
0
1
Order By: Relevance
“…No contexto da prova de redac ¸ão do ENEM, os pesquisadores têm explorado diversas abordagens para a avaliac ¸ão automática das competências consideradas no exame, utilizando as rubricas de correc ¸ão predefinidas. Em um estudo conduzido por [Marinho et al 2022b], foi apresentada uma pesquisa abrangendo diferentes estratégias e algoritmos de regressão para cada uma das cinco competências avaliadas no ENEM utilizando a base de dados do Essay-BR estendido [Marinho et al 2022a]. Para cada competência, foram investigadas três abordagens: uma baseada em características, a utilizac ¸ão de representac ¸ões multidimensionais (embeddings) das redac ¸ões em conjunto com algoritmos tradicionais de AM, e o uso de redes neurais recorrentes.…”
Section: Trabalhos Relacionadosunclassified
See 3 more Smart Citations
“…No contexto da prova de redac ¸ão do ENEM, os pesquisadores têm explorado diversas abordagens para a avaliac ¸ão automática das competências consideradas no exame, utilizando as rubricas de correc ¸ão predefinidas. Em um estudo conduzido por [Marinho et al 2022b], foi apresentada uma pesquisa abrangendo diferentes estratégias e algoritmos de regressão para cada uma das cinco competências avaliadas no ENEM utilizando a base de dados do Essay-BR estendido [Marinho et al 2022a]. Para cada competência, foram investigadas três abordagens: uma baseada em características, a utilizac ¸ão de representac ¸ões multidimensionais (embeddings) das redac ¸ões em conjunto com algoritmos tradicionais de AM, e o uso de redes neurais recorrentes.…”
Section: Trabalhos Relacionadosunclassified
“…O corpus Essay-BR [Marinho et al 2021] tem sido utilizado em diversos trabalhos para avaliac ¸ão automática de redac ¸ões no contexto do ENEM [Marinho et al 2022b, Oliveira et al 2022, Oliveira et al 2023]. Recentemente, foi apresentada uma nova versão desse corpus, chamado de Essay-BR estendido [Marinho et al 2022a], com a inclusão de novas redac ¸ões. O corpus Essay-BR estendido é composto originalmente de 6.579 redac ¸ões dissertativas-argumentativas escritas seguindo o formato das redac ¸ões presentes no ENEM.…”
Section: Corpus Essay-br Estendidounclassified
See 2 more Smart Citations
“…Investigaram-se métodos baseados em engenharia de features [Sarkar 2019], embeddings [Le and Mikolov 2014] e rede neurais recorrentes (do inglês, Recurrent Neural Network -RNN) do tipo Long Short-Term Memory (LSTM) [Hochreiter and Schmidhuber 1997] para implementar cinco modelos de AAR independentes e capazes de predizer as notas das competências da redac ¸ão do ENEM. Esses modelos foram avaliados em um corpus publicamente disponível [Marinho et al 2022], alcanc ¸ando resultados superiores aos trabalhos relacionados.…”
Section: Introduc ¸ãOunclassified