2022
DOI: 10.3389/frai.2022.1008530
|View full text |Cite
|
Sign up to set email alerts
|

A hybrid model of complexity estimation: Evidence from Russian legal texts

Abstract: This article proposes a hybrid model for the estimation of the complexity of legal documents in Russian. The model consists of two main modules: linguistic feature extractor and a transformer-based neural encoder. The set of linguistic metrics includes both non-specific metrics traditionally used to predict complexity, as well as style-specific metrics developed in order to deal with the peculiarities of official texts. The model was trained on a dataset constructed from text sequences from Russian textbooks. … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
5

Citation Types

0
1
0
7

Year Published

2023
2023
2024
2024

Publication Types

Select...
2
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(8 citation statements)
references
References 39 publications
0
1
0
7
Order By: Relevance
“…Упоминаемые в различных работах признаки чрезвычайно разнообразны. В исследованиях, посвящённых оценке сложности русскоязычных текстов, помимо традиционно используемых признаков, таких как средние длины слов и предложений, встречается использование оценок лексического разнообразия [4][5][6], морфологических [5][6][7][8][9], синтаксических [6,[8][9][10], лексических [6-9, 11, 12], семантических [9], тематических [6] признаков.…”
Section: Introductionunclassified
See 4 more Smart Citations
“…Упоминаемые в различных работах признаки чрезвычайно разнообразны. В исследованиях, посвящённых оценке сложности русскоязычных текстов, помимо традиционно используемых признаков, таких как средние длины слов и предложений, встречается использование оценок лексического разнообразия [4][5][6], морфологических [5][6][7][8][9], синтаксических [6,[8][9][10], лексических [6-9, 11, 12], семантических [9], тематических [6] признаков.…”
Section: Introductionunclassified
“…Для оценки лексической сложности текста обычно используют характеристики, связанные с частотностью слов [6,9,12,13]. При этом ряд исследований показал, что частотность, вычисленная на основании какого-либо корпуса, достаточно часто отличается от реальной распространённости и знакомости слов [11,13].…”
Section: Introductionunclassified
See 3 more Smart Citations