2008
DOI: 10.3166/dn.11.1-2.37-61
|View full text |Cite
|
Sign up to set email alerts
|

Détection d'opinion. Comment déterminer les adjectifs d'opinion d'un domaine donné

Abstract: L'extraction automatique d'opinions sur le web 2.0 est un domaine de recherche de plus en plus étudié. Elle utilise souvent deux méthodes à vocations différentes : soit des méthodes fondées sur l'apprentissage par la constitution de corpus en vue d'établir des modèles pour la classification, soit rechercher des mots caractéristiques tels que les adjectifs qui contribueront à la classification des textes. Dans ce dernier cas, les outils existants utilisent des dictionnaires généraux, et possèdent des limites : … Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1

Citation Types

0
0
0
1

Year Published

2014
2014
2023
2023

Publication Types

Select...
2
2

Relationship

0
4

Authors

Journals

citations
Cited by 4 publications
(1 citation statement)
references
References 15 publications
0
0
0
1
Order By: Relevance
“…Un mot est considéré comme d'autant plus positif qu'il est plus proche des germes positifs et plus éloigné des germes négatifs. Pouvant être appliquées à des corpus de très grandes tailles (des milliards de mots récoltés sur le web comme l'ont fait Velikovich et al, 2010) ou à des corpus spécifiques à une application (Harb et al, 2008), ces techniques répondent aux limitations des approches basées sur des ressources linguistiques, mais s'appuient sur des informations plus bruitées que celles qui sont encodées manuellement par des linguistes dans des ressources comme Wordnet ou comme un dictionnaire de synonymes. Récemment, ont montré que les approches basées sur des corpus étaient plus efficaces que celles basées sur des ressources linguistiques et qu'elles permettaient de générer des normes lexicales ayant une fiabilité équivalente à celles obtenues en demandant à des juges d'évaluer les mots.…”
Section: éTat De L'artunclassified
“…Un mot est considéré comme d'autant plus positif qu'il est plus proche des germes positifs et plus éloigné des germes négatifs. Pouvant être appliquées à des corpus de très grandes tailles (des milliards de mots récoltés sur le web comme l'ont fait Velikovich et al, 2010) ou à des corpus spécifiques à une application (Harb et al, 2008), ces techniques répondent aux limitations des approches basées sur des ressources linguistiques, mais s'appuient sur des informations plus bruitées que celles qui sont encodées manuellement par des linguistes dans des ressources comme Wordnet ou comme un dictionnaire de synonymes. Récemment, ont montré que les approches basées sur des corpus étaient plus efficaces que celles basées sur des ressources linguistiques et qu'elles permettaient de générer des normes lexicales ayant une fiabilité équivalente à celles obtenues en demandant à des juges d'évaluer les mots.…”
Section: éTat De L'artunclassified