2017
DOI: 10.21494/iste.op.2018.0208
|View full text |Cite
|
Sign up to set email alerts
|

Représentation vectorielle de documents pour l’indexation de notices bibliographiques

Abstract: Cet article présente la contribution d'eXenSa à l'édition 2016 du DÉfi Fouille de Textes (DEFT) dont la tâche consiste à indexer des documents scientifiques par des mots-clefs, préalablement sélectionnés par des professionnels. Le système proposé est purement statistique et combine une approche graphique et une approche sémantique. La première approche cherche dans le titre et le résumé du document des mots graphiquement proches des mots-clefs du thésaurus. La seconde approche attribue à un nouveau document de… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
2

Year Published

2017
2017
2022
2022

Publication Types

Select...
2
1

Relationship

0
3

Authors

Journals

citations
Cited by 3 publications
(2 citation statements)
references
References 10 publications
0
0
0
2
Order By: Relevance
“…La méthode développée par l'équipe EXENSA [MAFP16] est une combinaison de deux méthodes complémentaires d'indexation automatique. La première est une approche de type assignation nonsupervisée, basée sur la recherche de similarité graphique (via une analyse des n-gram de caractères) entre les mots-clés contrôlés des thésaurus et le lexique des notices de test.…”
Section: Comparaison Avec Les Méthodes Des Autres éQuipes Participantesunclassified
“…La méthode développée par l'équipe EXENSA [MAFP16] est une combinaison de deux méthodes complémentaires d'indexation automatique. La première est une approche de type assignation nonsupervisée, basée sur la recherche de similarité graphique (via une analyse des n-gram de caractères) entre les mots-clés contrôlés des thésaurus et le lexique des notices de test.…”
Section: Comparaison Avec Les Méthodes Des Autres éQuipes Participantesunclassified
“…document, corpus) qui sont caractéristiques de l'unité au regard d'un objectif prédéfini. Elle est généralement exploitée dans l'indexation(Marchand et al, 2016) et le résumé de documents textuels(Gupta & Lehal, 2010). Les mots-clés peuvent dans certains cas être conceptualisés comme un sous-ensemble de méta-données de nature sémantique associées à ces documents.…”
unclassified