AccueilUsages de la lexicométrie en sociologie

*  *  *

Publié le vendredi 01 février 2013 par Loïc Le Pape

Résumé

Nous organisons une journée d’étude sur les « usages de la lexicométrie en sciences sociales » – et particulièrement en sociologie – sous le thème général de l’interprétation sociologique, interprétation permise ou induite par la lexicométrie ou à des outils informatiques d'analyse de texte. Deux axes de réflexion seront privilégiés dans cette journée, l’un portant sur les pratiques de constitution et de préparation de corpus textuels, l’autre sur les pratiques d’interprétation qui permettent de passer des opérations et des résultats issus du traitement informatisé du langage à des hypothèses, voire à des conclusions, d’ordre sociologique.

Annonce

Argumentaire

Le fait que l'usage du langage soit un lien social majeur, comme communication, comme activité et comme représentation et construction du monde social est aujourd'hui communément admis. Cependant la prise en compte du langage en sociologie dans les études empiriques est une question complexe : les niveaux d'observation, les objets et les méthodes des sciences du langage et des sciences de la société, ainsi que les processus explicatifs ou interprétatifs, ne sont pas a priori les mêmes.

La question qui se pose est de savoir en quoi la prise en compte rigoureuse du langage, c'est-à-dire en respectant les données langagières et les articulations propres au langage (syntaxe, énonciation, distribution lexicale, etc.), et en s'abstenant d'une interprétation trop rapide des discours, c'est-à-dire en ne considérant pas que le sens est donné d'emblée, peut nous conduire à des hypothèses ou des conclusions proprement sociologiques.

Les recherches des dernières décennies en analyse de discours, en pragmatique, en linguistique et sociolinguistique, en sociologie ont montré qu'il est possible de tisser des liens féconds. De plus, une grande majorité des données en sociologie sont langagières, ou s'inscrivent dans du langage (entretiens, questions ouvertes, débats, textes, catégorisations, interactions, etc.). Enfin, des chercheurs de plus en plus nombreux s'appuient sur des méthodes des sciences du langage (statistiques ou non) pour interpréter les discours ou pour reformuler les problématiques et les objets sociologiques.

Or en sociologie, ainsi que dans d’autres sciences sociales (sciences politiques, histoire, psychologie sociale notamment), les chercheurs ont de plus en plus recours aux ressources de la lexicométrie (ou textométrie) informatisée, ou à des outils informatiques d'analyse de texte pour analyser leurs matériaux langagiers, les décrire, formuler des hypothèses, guider leur cheminement.

C'est pourquoi nous vous proposons une journée d’étude sur les « usages de la lexicométrie en sciences sociales », et particulièrement en sociologie. De plus, nous avons souhaité placer cette journée de lexicométrie sous le thème général de « l'interprétation sociologique » permise ou induite par ce type d’analyse des données langagières. Les questions techniques ne seront pas abordées en tant que telles, mais dans la mesure où elles ont un effet sur le cheminement de la recherche et les interprétations élaborées.

Deux axes de réflexion seront privilégiés, l’un portant sur les corpus, l’autre sur l’interprétation proprement dite. Nous demandons aux contributeurs de s’appuyer sur leur propre expérience de recherche et de réfléchir aux questions suivantes :

Axe 1. Pratiques de constitution et de préparation de corpus textuels

L’analyse lexicométrique exige de travailler sur des corpus délimités, clos. Cette contrainte exige une réflexion méthodologique sur le cheminement menant de la constitution à l’analyse du corpus. Une telle réflexion permettrait d’éviter le risque de considérer le corpus comme un point de départ "neutre" de l’enquête. Une manière d’aborder ces questions peut passer par la distinction entre "constitution" et "préparation" du corpus : la première notion concernerait le corpus de recherche au sens large, incluant toute sorte de matériaux et de choix relatifs à l’enquête (textuels ou pas, fabrication de collections, type de locuteurs, etc.), alors que la seconde toucherait l’apprêtement, la mise en forme textuelle et informatique de ces matériaux (avec le balisage, par ex.), en vue d’un calcul lexicométrique. Lors de l’étape de préparation plusieurs questions sont tranchées, comme celles relatives aux choix structurels tels que le regroupement de textes dans des sous-parties mais aussi celles relatives à une critériologie sous-jacente : utilisation de variables sociologiques caractérisant chaque texte, homogénéisation des textes en termes de conditions de production, etc.

Les intervenants sont invités à présenter des travaux et des réflexions basés sur leur expérience de chercheur ayant mobilisé la lexicométrie. Il s’agira de rendre compte du pas-à-pas et des questionnements méthodologiques qui se sont présentés à vous avant les opérations de calcul et les interprétations des données, ainsi que des allers-retours entre corpus et résultats statistiques. Nous nous intéressons à la manière dont vous vous êtes confrontés concrètement aux fonctionnalités techniques des logiciels (découpage, cartographie, lemmatisation...) et à la manière dont celles-ci ont eu (ou pas) un effet sur la préparation du corpus et sur vos stratégies d’investigation (comparaison de sous-corpus, recherche de proximités, calcul fréquentiel, etc.). Aussi, il pourra être question d’aspects matériels et formels : comment avez-vous géré les problèmes liés à la taille du corpus ; quels sont les effets des choix de retranscription de corpus oraux sur les possibilités et les modalités de leur traitement ; quelles sont les contraintes de la numérisation sur la constitution du corpus (scans de la presse écrite), etc. Il s’agira ainsi d’éclairer les enjeux passés et à venir de la lexicométrie à partir de la manière dont son usage réel modifie le parcours méthodologique, voire les objets de recherche.

Axe 2. Pratiques d’interprétation

L’axe 2 est centré sur les pratiques d’interprétation, sachant que ce sont ces pratiques et cheminements qui permettent de passer des opérations et des résultats du traitement des matériaux langagiers à des hypothèses, voire à des conclusions d’ordre sociologique. Or, on peut constater que les interprétations se font à tous les moments et à tous les niveaux d’analyse : que ce soient des interprétations du matériau lui-même conduisant à des transformations du corpus (voir axe 1), des interprétations au fur et à mesure de l’analyse, des interprétations plus globales, visant à des hypothèses sociologiques.

Nous souhaitons que les contributeurs réfléchissent à leurs cheminements et pratiques d’interprétation à tous les niveaux, en commençant par clarifier leur point de vue sur les rapports « langage-société », ou dit en d’autres termes : l’analyse du langage est-elle un éclairage, une trace ou indice des rapports sociaux, une construction des faits sociaux ? Puis en clarifiant l’usage qu’ils veulent faire des données langagières (par exemple illustration d’hypothèses, analyse et restitution d’un « contenu », d’une structure discursive, de parcours de vie, mise au jour d’actes socio-langagiers, d’interactions, de circulations d’éléments discursifs, de régularités et d’écarts). Le but est-il le discours lui-même (par exemple sa structuration, sa circulation, un usage du vocabulaire), le rapport entre le discours et la situation, le rapport entre le discours et les faits sociaux ?

Il est souhaité que les participants mobilisent des exemples précis, et décrivent des opérations interprétatives très concrètes qui ont pu « faire séquence » dans la recherche et (ré)orienter leurs analyses et programme de travail.

Nous souhaitons plus généralement que les contributeurs réfléchissent aux possibilités et aux contraintes engendrées par les logiciels. La recherche outillée par l’analyse textuelle prend la forme d’un dialogue homme/machine à visée de production scientifique, dans lequel les logiciels imposent des cadrages d’analyse des données (par exemple lemmatisation ou non), des raisonnements (essentiellement liés à la statistique textuelle), des mises en formes et des visualisations des résultats (diagrammes, matrices, projection sur des axes, nuages de points, etc.). Comment ces éléments reconfigurent aux différents moments de l’analyse le cheminement de la recherche mais également les interprétations qui s’ensuivent ? Quels sont les nouveaux modes de validation liés aux modèles fréquentialistes ? Peut-on affirmer que ces logiciels en tant qu’actants de la recherche induisent de nouvelles heuristiques et de nouvelles formes de légitimation des résultats en analyse du discours ? Au final, à quel type d’interprétation et d’objets sociologiques aboutit-on par l’usage des logiciels lexicométriques ?

Modalités de soumission 

Les contributions (une vingtaine de minutes) ne doivent donc pas être un exposé des recherches et résultats, mais ouvrir le débat sur ces questions.

Les propositions de contributions sont à envoyer à contactprintemps@uvsq.fr

Vous pouvez consulter les textes préparatoires à la journée d'études, ainsi qu'un bref compte rendu du questionnaire envoyé (à venir en janvier) sur le site du Laboratoire Printemps www.printemps.uvsq.fr, rubrique carnet de recherches / hypothèses.

La sélection sera effectuée par les coordinateurs, soutenus et aidés par les membres du laboratoire Printemps.

Calendrier

  • 15 mars 2013 : date limite d’envoi des propositions de communication (résumé en une page)

  • 8 avril 2013 : réponses aux contributeurs
  • 24 mai 2013 : date limite d’envoi des  textes, 35 000 signes maximum tout compris (espaces, notes et références bibliographiques).
  • 12 juin 2013 : journée d'études
  • 2014 : publication

Coordination de la journée d'études 

  • Atelier « approches discursives en sociologie » du Laboratoire Printemps », avec l'aide du fonds Alceste-CNRS et en collaboration avec l’Association Internationale des Sociologues de Langue Française – GT 16 Sociologie du Langage (Marie-Hélène Delobbe, Marc Glady, Isabelle Lacroix, Natalia La Valle, François Leimdorfer, Fabio Marcodoppido, Max Reinert, Monique Sassier, Clara Tomasini, Mona Zegaï)
  • laboratoire Printemps. 47 Bd Vauban, 78047 Guyancourt (station SNCF Saint-Quentin-en-Yvelines) http://www.printemps.uvsq.fr 

Lieux

  • Laboratoire Printemps (station SNCF Saint-Quentin-en-Yvelines) - 47 boulevard Vauban
    Guyancourt, France (78)

Dates

  • vendredi 15 mars 2013

Mots-clés

  • lexicométrie, sociologie, sciences sociales, langage

Source de l'information

  • Isabelle Lacroix
    courriel : isalacroix [at] aol [dot] com

Pour citer cette annonce

« Usages de la lexicométrie en sociologie », Appel à contribution, Calenda, Publié le vendredi 01 février 2013, http://calenda.org/237428