2018
DOI: 10.1007/978-3-319-99722-3_46
|View full text |Cite
|
Sign up to set email alerts
|

Tagsets and Datasets: Some Experiments Based on Portuguese Language

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
2
2

Citation Types

0
2
0
2

Year Published

2020
2020
2020
2020

Publication Types

Select...
1
1
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(4 citation statements)
references
References 7 publications
0
2
0
2
Order By: Relevance
“…Several scientific articles report the use of POS tagging in Brazilian Portuguese (pt-BR) journalistic texts (Fernandes et al, 2014;Freitas et al, 2018;Dos Santos and Zadrozny, 2014;de Sousa and Lopes, 2019). Dos Santos and Zadrozny (2014) performed POS tagging using a neural network extended from Collobert's work (Collobert, 2011), associating character-level representation with the usual word representations.…”
Section: Introductionmentioning
confidence: 99%
See 1 more Smart Citation
“…Several scientific articles report the use of POS tagging in Brazilian Portuguese (pt-BR) journalistic texts (Fernandes et al, 2014;Freitas et al, 2018;Dos Santos and Zadrozny, 2014;de Sousa and Lopes, 2019). Dos Santos and Zadrozny (2014) performed POS tagging using a neural network extended from Collobert's work (Collobert, 2011), associating character-level representation with the usual word representations.…”
Section: Introductionmentioning
confidence: 99%
“…It also achieved good results on unseen data. Freitas et al (2018) created two corpora: The Mac-Morpho-UD (original Mac-Morpho corpus converted to the Universal Dependencies tagset) and the Mac-Morpho-UD+ PCP, which is the same as the previous with the PCP tag (past participle). Their work consists of two experiments: (1) verify the impact of tagsets on system performance and (2) verify the impact of size and quality in training using the Mac-Morpho-UD and the UD-Portuguese-Bosque.…”
Section: Introductionmentioning
confidence: 99%
“…Em um contexto parecido, Freitas et al (2018) decidiram adicionar uma etiqueta, PCP, no corpus Mac-Morpho (ALUÍSIO et al, 2003) convertido para a gramática do projeto UD, com o objetivo de eliminar a mesma pouca especificação entre verbo e adjetivo nas formas participiais em certos contextos. Essa pequena modificação levou a um aumento na acurácia de um dado sistema que, sem a etiqueta PCP, conseguia acurácia de 0,9607 na atribuição de POS, e com a etiqueta alcançou 0,9624.…”
Section: Sobre Avaliação De Treebanksunclassified
“…Embora seja uma melhora sutil, dá suporte à tese de Manning de que uma seara a ser explorada para melhorar o desempenho dos anotadores está na modelagem linguística. Além disso, Freitas et al (2018) concluem também que, embora seja razoável afirmar que esquemas de anotação granulares sejam mais difíceis de serem aprendidos -como vimos, sistemas precisam generalizar a partir de exemplos categorizados em classes amplas, de modo que novas etiquetas tendem a dificultar a criação de agrupamentos robustos -, é também verdade que fenômenos pouco especificados, quando são de difícil distinção, podem se beneficiar de uma classe específica para agrupálos, como é o caso dos PCP.…”
Section: Sobre Avaliação De Treebanksunclassified