Anais Do XXXIX Simpósio Brasileiro De Banco De Dados (SBBD 2024) 2024
DOI: 10.5753/sbbd.2024.242494
|View full text |Cite
|
Sign up to set email alerts
|

PREAnoTe: Uma abordagem de anotação de corpus para o ajuste fino de Large Language Model pré-treinado

Jones O. Avelino,
Giselle F. Rosa,
Gustavo R. Danon
et al.

Abstract: O ajuste fino de um Modelo de Linguagem (ML) necessita de corpus volumoso, categorizado e anotado. Contudo, corpora são escassos e a anotação manual é custosa. Como alternativa, surgiu a abordagem Distant Supervision que pode usar Recursos Semânticos (RS). Entretanto, há lacunas na utilização de RS para minimizar o custo da anotação. Este artigo propõe PREAnoTe, uma abordagem capaz de apoiar a anotação, utilizando regras de expressão regular, orientado por um metamodelo e RS. Os experimentos mostraram resultad… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...

Citation Types

0
0
0

Publication Types

Select...

Relationship

0
0

Authors

Journals

citations
Cited by 0 publications
references
References 8 publications
0
0
0
Order By: Relevance

No citations

Set email alert for when this publication receives citations?