2022
DOI: 10.1007/s10579-022-09609-0
|View full text |Cite
|
Sign up to set email alerts
|

RastrOS Project: Natural Language Processing contributions to the development of an eye-tracking corpus with predictability norms for Brazilian Portuguese

Abstract: This article presents RastrOS, a new eye-tracking corpus of eye movement data from university students during silent reading of paragraphs of texts in Brazilian Portuguese (BP). The article shows the potential of the corpus for natural language processing (NLP) using it to evaluate the sentence complexity prediction task in BP and it also focuses on the description of NLP resources and methods developed to create the corpus. Specifically, we present: (i) the method used to select the corpus paragraphs from lar… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...

Citation Types

0
0
0
1

Year Published

2023
2023
2024
2024

Publication Types

Select...
2
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(1 citation statement)
references
References 30 publications
0
0
0
1
Order By: Relevance
“…Para isto, foi desenvolvido um corpus combinado, formado por textos classificados conforme o público-alvo da revista ou jornal de origem. O melhor classificadorLeal (2019) avaliou métodos de predição de complexidade de frases para o PB.Para isto, foram criados dois corpora, um com sentenças alinhadas peloPorSimples, o PorSimplesSent (LEAL et al, 2018), e outro com métricas de rastreamento ocular e normas de previsibilidade para estudantes de nível superior, denominado RastrOS(LEAL et al, 2022b). Foi considerada a versão mais recente da ferramenta NILC-Metrix(LEAL et al, 2021) (com 200 métricas), bem como abordagens de transferência de aprendizado com adição das métricas de rastreamento ocular Leal (2019).…”
unclassified
“…Para isto, foi desenvolvido um corpus combinado, formado por textos classificados conforme o público-alvo da revista ou jornal de origem. O melhor classificadorLeal (2019) avaliou métodos de predição de complexidade de frases para o PB.Para isto, foram criados dois corpora, um com sentenças alinhadas peloPorSimples, o PorSimplesSent (LEAL et al, 2018), e outro com métricas de rastreamento ocular e normas de previsibilidade para estudantes de nível superior, denominado RastrOS(LEAL et al, 2022b). Foi considerada a versão mais recente da ferramenta NILC-Metrix(LEAL et al, 2021) (com 200 métricas), bem como abordagens de transferência de aprendizado com adição das métricas de rastreamento ocular Leal (2019).…”
unclassified