2015
DOI: 10.1051/shsconf/20152001009
|View full text |Cite
|
Sign up to set email alerts
|

Traitement de données issues d’un corpus écrit multilingue. Approche agile pour l’analyse du discours eurorégional

Abstract: Résumé. L'article présente quelques éléments de la procédure mise en place pour traiter un corpus écrit comportant 617 textes (près de 500 000 mots) relatifs aux eurorégions. Complexe et hétérogène à plusieurs titres (technique, linguistique, éditorial, générique, énonciatif), le corpus pose la difficulté majeure de l'appréhension de données multilingues (français, italien, espagnol, anglais, allemand, néerlandais). Sa manipulation a nécessité une réflexion adaptée et une démarche de modélisation que nous qual… Show more

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1

Citation Types

0
1
0
1

Year Published

2016
2016
2024
2024

Publication Types

Select...
6
1

Relationship

2
5

Authors

Journals

citations
Cited by 7 publications
(2 citation statements)
references
References 11 publications
0
1
0
1
Order By: Relevance
“…The concordance tool was used to analyse the denominations in their own context and to identify the way different social actors negotiate the meaning of refugee to justify the inclusion of Ukrainians in this category. As the corpus is bilingual, all analyses led on TXM were run separately, as recommended by Hermand (2015). All examples have been translated into English and annotated by outlet, country and publication date.…”
Section: Corpus and Methodologymentioning
confidence: 99%
“…The concordance tool was used to analyse the denominations in their own context and to identify the way different social actors negotiate the meaning of refugee to justify the inclusion of Ukrainians in this category. As the corpus is bilingual, all analyses led on TXM were run separately, as recommended by Hermand (2015). All examples have been translated into English and annotated by outlet, country and publication date.…”
Section: Corpus and Methodologymentioning
confidence: 99%
“…Pour ce faire, nous utilisons le logiciel de textométrie TXM 14 , qui présente le triple avantage de pouvoir dresser un aperçu de l'usage d'unités lexicales en termes statistiques, de neutraliser les éventuelles variations en taille des différents souscorpus et de procurer un retour au texte aisé pour chaque occurrence à l'aide du concordancier. Parce que ce logiciel ne permet pas de comparer directement les deux langues, les sous-corpus du CIRÉ et de Vluchtelingenwerk ont été traités séparément et comparés manuellement (Hermand & Thouraud, 2015). Les rapports annuels (corpus 1) permettent d'objectiver la mesure dans laquelle la citoyenneté est discutée par chacune des associations en comparant les fréquences relatives des occurrences de citoyen et ses dérivés au sein de chaque corpus 15 .…”
Section: Les Enjeux Socio-discursifs De Citoyen / Burger Et De Leurs ...unclassified