2021
DOI: 10.1007/s10579-021-09565-1
|View full text |Cite
|
Sign up to set email alerts
|

Broad coverage emotion annotation

Abstract: In this paper we present the emotion annotation of 1.5 billion words Portuguese corpora, publicly available. We motivate the annotation process and detail the decisions made. The resource is evaluated, being applied to different areas: to study Lusophone literature, to obtain paraphrases, and to do genre comparison.

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2
1

Citation Types

0
2
0
3

Year Published

2022
2022
2024
2024

Publication Types

Select...
3
1

Relationship

1
3

Authors

Journals

citations
Cited by 4 publications
(5 citation statements)
references
References 32 publications
0
2
0
3
Order By: Relevance
“…States that it takes a lot of resources to create sentiment lexicons for multiple languages or mixed codes. Emotion detection [ [2] , [3] ] plays a vital role in accomplishing several tasks [4] , such as behavior recognition, etc. The raw text written in any language must be annotated before using natural language processing algorithms to extract linguistic aspects [5] .…”
Section: Data Descriptionmentioning
confidence: 99%
See 1 more Smart Citation
“…States that it takes a lot of resources to create sentiment lexicons for multiple languages or mixed codes. Emotion detection [ [2] , [3] ] plays a vital role in accomplishing several tasks [4] , such as behavior recognition, etc. The raw text written in any language must be annotated before using natural language processing algorithms to extract linguistic aspects [5] .…”
Section: Data Descriptionmentioning
confidence: 99%
“…Here, “ maza aagaya ” and “ chalta hai ” are from the native language, which means “ it was fun " and “ that's what everyone does ,” respectively. We have prepared the dataset using the analysis of Roman Urdu's linguistic features since the construction of an emotion-detecting lexicon entails a deep analysis of linguistic properties [2 , 6] . This dataset consists of emotion lexicons in both English and Roman Urdu.…”
Section: Data Descriptionmentioning
confidence: 99%
“…A anotação das entidades contou com a supervisão de especialistas da área, e foi realizada por meio da aplicação de regras linguísticas. Todo o procedimento de anotação semântica se inspirou no corte-e-costura (Mota & Santos, 2009;Santos & Mota, 2010), ferramenta de auxílio à anotação semântica dos corpora do projeto AC/DC (Santos & Sarmento, 2003;Santos, 2011).…”
Section: Apresentaçãounclassified
“…Os principais usos do corte-e-costura são na anotação semântica: a adição dos atributos "sema" e "grupo" e identificação de expressões multipalavras (EVPs ou MWEs). Dentre os objetivos da ferramenta estão a criação de mecanismos e procedimentos para anotação semântica semiautomática (Santos & Mota, 2010:1441 que conseguissem resultados positivos de forma rápida e que fossem reaplicáveis a cada vez que o AC/DC passasse por mudanças na anotação.…”
Section: Ferramentas De Anotação: Corte-e-costura E Vislcg3unclassified
“…O corte-e-costura é composto por quatro conjuntos de regras (Santos & Mota, 2010:1442: positivas, negativas, de especialização e recursivas. Em relação ao campo semântico das emoções, as duas primeiras são as mais relevantes.…”
Section: Ferramentas De Anotação: Corte-e-costura E Vislcg3unclassified