Du recueil à l'outillage des corpus oraux : comment accéder à la variation ? Vers un outillage informatique optimisé pour corpus langagiers oraux en vue d'une exploitation textométrique : le cas des interrogatives partielles dans ESLO
In this paper we report and analyse data from the ESLO corpus of oral French, constituted during two time periods (1960–2010), allowing for an in-depth exploration of French partial interrogatives under a refined sociolinguistic perspective. With an original methodology for extracting the data we were able to create several subcorpora based on age of the speakers, interactive context and time period. The combination of all the data and the use of raw frequencies as well as Bayesian modeling shed new light on the variation available to French native speakers as to how they can structure a partial interrogative (position of the interrogative element, verb-subject inversion, “est-ce que” idiom). This variation has evolved throughout the 20th century, and both the social group (age) of the speaker and perceived characteristics of the context of interaction combine in different ways to weigh on what type of partial interrogative people will use.
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
RÉSUMÉDans cette contribution, nous analysons un corpus de chansons ayant accédé à la première place de classements musicaux réalisés pour la France entre 1956 et 2017. Cette base de données nous permet de nous questionner sur le type d’oralité que produit l’industrie du disque francophone. Si les chansons présentent des caractéristiques conceptionnelles relevant de la distance (Koch et Oesterreicher, 2001), quelques traits linguistiques relevés sont pourtant illustratifs d’une proximité conceptionnelle. Nous nous intéressons plus particulièrement aux liaisons dans les chansons, à leur possible réalisation dans ces productions préparées en comparaison avec des corpus spontanés ou de locuteurs professionnels, aux liaisons variables (que nous considérons comme une marque de distance) et à l’évolution diachronique de leur réalisation. Pour mener à bien cette analyse, nous avons utilisé un outil facilitant l’étude sur corpus des liaisons, que nous présenterons. C’est surtout la réalisation de certaines liaisons variables, comme après suis, étais ou jamais, plus spécifiquement réalisées dans notre corpus, qui concourt au caractère distant de ces productions langagières. Au fil du temps, la réalisation des liaisons variables a diminué dans les chansons, par exemple après est ou préposition, les rapprochant de productions relevant de la proximité.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.