AccueilAnalyse informatisée et interprétation des discours en sciences du langage, didactique des langues et sciences des textes littéraires

Analyse informatisée et interprétation des discours en sciences du langage, didactique des langues et sciences des textes littéraires

IT analysis and the representation of discourse in language sciences, language teaching and the science of literary texts

Deuxièmes journées régionales de formation en logométrie et initiation au logiciel Lexico3

Second regional training day in logometrics and training in Lexico 3 software

*  *  *

Publié le vendredi 01 avril 2016 par Céline Guilleux

Résumé

Le laboratoire « Langue et communication » dirigé par Dr Meflah Benabdellah, du Centre universitaire Ahmed Zabana de Relizane, organise les 27 et 28 avril 2016, les deuxièmes journées régionales de formation en logométrie, destinées aux enseignants-chercheurs de universités de l’Ouest algérien, préparant un mémoire de magister ou une thèse de doctorat (classique ou LMD) de langue française.

Annonce

Présentation

Livres, journaux, magazines, revues scientifiques et autres corpus textuels, sont de plus en plus disponibles sous forme numérisée. Il suffit d’un clic pour accéder à une extraordinaire masse de textes couvrant tous les domaines. Ainsi, ce qui n’était hier encore qu’un rêve est aujourd’hui une réalité à portée de la main.

Aujourd'hui donc qu'une grande partie des productions langagières est numérique et est accessible souvent gratuitement par Internet, il serait dommage que nous ne profitions pas de l'apport considérable que nous offre un traitement assisté par ordinateur de ces corpus.

En effet, il serait pour le moins incompréhensible de continuer d’appréhender les textes volumineux, c’est-à-dire composé de centaines de milliers d’occurrences, de la  manière traditionnelle, qui exige énormément de temps et qui souvent ne nous permet pas une analyse complète et rigoureuse, alors que nous avons aujourd’hui la possibilité de le faire avec des logiciels de logométrie très performants et riches en informations, qui sont mis à notre disposition le plus souvent gratuitement.

Oui, à présent, il ne nous est plus permis d’ignorer ces puissants outils informatiques. Pour s'en convaincre, songeant par exemple au temps et au travail qu’exigerait une étude des discours de Houari Boumediène, président de l’Algérie de 1965 à 1978, sur l'œuvre complète de l’écrivaine algérienne AssiaDjebbar, sur un corpus constitué de la production annuelle d'un journal comme El Watan, ou sur un corpus de manuels scolaires, sans l'aide d'un logiciel comme Lexico 3.

Objectifs des deux journées

  • Comprendre les fondements théoriques et statistiques des analyses logométriques
  • Utiliser concrètement le logiciel Lexico3

La logométrie et les sciences humaines et sociales

Considérée comme un prolongement de la lexicométrie (mesure du lexique) et de la textométrie (mesure du texte), la logométrie (logos = discours ; métrie = mesure) est une méthode d’analyse et d'interprétation des discours utilisée dans les sciences humaines et sociales

Cette méthode, assistée par ordinateur, permet de décrire qualitativement et quantitativement un corpus numérique même de grande taille. Elle combine aussi lecture globale (tout le discours) et lecture locale (les unités du discours) pour construire l'interprétation. Elle est basée essentiellement sur des outils de recherche (concordanciers, recherche de contextes, navigation hypertextuelle) et sur des outils statistiques et mathématiques susceptibles de caractériser un texte (dictionnaire de fréquences, calcul du vocabulaire caractéristique, distances intertextuelles, richesse du vocabulaire, accroissement lexical chronologique, etc.).

Cette méthodologie  est de plus en plus employée comme outil d'investigation. En effet :

 « L’ensemble des Sciences humaines et sociales a centralement affaire aux mots, aux textes, aux discours. Que le texte soit considéré comme archive par l’historien ou objet pour le littéraire, que le discours soit perçu comme témoin ou comme acteur pour le politologue, que le langage soit posé comme commencement pour la psychanalyse ou comme fin pour les Sciences du langage… : nous travaillons tous avec ou sur du matériau linguistique. […] Partant, la réflexion sur les textes ou les discours –leur composition, les méthodes pour les traiter, leur compréhension ou leur interprétation– n’est pas un luxe mais une nécessité, sauf à s’abandonner à la lecture instinctive, à l’interprétation libre et à une démarche intuitive infra scientifique. Précisément, il s’agira de présenter une méthode d’approche globale des textes susceptible de décrire le lexique et la grammaire, les réseaux thématiques et les structures rhétoriques ; susceptible, surtout, de baliser les parcours de lecture pour objectiver, autant que faire se peut, l’interprétation. » [1]

Plusieurs logiciels sont utilisés en logométrie tels Lexico3, Hyperbase, Astartex-diatag, Weblex, Alceste, Cordial, Tropes, Spad-t, DTM, Sphynx Lexica…

Exemples d’application de Lexico3

Le logiciel Lexico3 peut être employé, par exemple, pour calculer la taille (ou longueur ou étendue) d’un texte, c’est-à-dire le nombre de mots qui le composent, dresser la liste de ces mots et correspondre à chacun d’eux sa fréquence absolue dans ce texte, c’est-à-dire le nombre de ses apparitions dans celui-ci.

De cette liste pouvant être obtenue, soit par ordre alphabétique, soit par ordre de fréquence décroissante, nous pouvons dégager les vocables fréquemment utilisés, ceux qui le sont rarement et ceux de fréquence moyenne. Ce qui nous donnerait une première idée sur la teneur du vocabulaire employé par le scripteur. Les fréquences peuvent également diriger notre attention sur des phénomènes qui sont invisibles à l’œil nu. Comment pourrait-on, par exemple, deviner dans un corpus de grande taille comme l’œuvre de Boudjedra, que tel vocable a été excessivement utilisé sans l’aide d’un ordinateur ?

Lexico3 permet aussi de quantifier la ponctuation utilisée dans notre texte ou notre corpus. Ce sont des informations importantes pour une analyse textuelle. En effet, de celles-ci, il nous serait possible de déterminer et d’accéder rapidement à toutes les phrases composant le texte étudié. D’attribuer à ces dernières une longueur moyenne, ce qui est important dans une étude stylistique.

On pourrait également extraire tous les contextes d’un mot qui nous intéresse, en particulier, afin de déterminer les termes qui sont « trop » employés dans son voisinage, et ceux qui le sont « insuffisamment ». Ce qui nous révélerait entre autres le sens que donne le scripteur à ce mot.

Ce logiciel sert, par ailleurs, à comparer deux ou plusieurs textes entre eux ou avec un corpus numérisé comme celui de la base Frantext. [2]

Il nous informe, par exemple, si un texte T1 est plus riche en vocabulaire qu’un texte T2. C’est-à-dire quel est celui qui contient plus de termes différents que l’autre. En d’autres termes, s’il y a répétition ou renouvellement des vocables utilisés.

Il nous dit comment évolue l’accroissement du vocabulaire en chacun d’eux et détermine les moments de variation significatifs dans l’apport de ce vocabulaire. En particulier, la statistique lexicale, par un simple découpage du texte en tranches, nous permet de déceler les parties qui ont connu un afflux de vocables nouveaux et nous indique la position où cette augmentation a eu lieu. Ce qui permet de savoir à quels moments de son discours le scripteur renouvelle son vocabulaire ou se répète. Le retour au texte nous révélerait alors les thèmes et les raisons de cette attitude.

Lexico3 nous donne, par ailleurs, des outils mathématiques pour mesurer la distance lexicale entre deux ou plusieurs textes, c’est-à-dire en gros le nombre de vocables qu’ils n’ont pas employé en commun.

Ce sont là quelques applications du Lexico3que nous aborderons lors des ateliers.

Nous ajouterons que les chiffres et les graphes obtenus par celui-ci, s’ils sont riches en informations, ne sont pas suffisants. En effet, l’étape capitale en statistique est l’interprétation des données chiffrées, obtenues lors de l’expérience réalisée sur un échantillon ou la population entière des unités concernées par l’analyse.

Notes

[1] L’analyse du discours assistée par ordinateur Formation – Damon Mayaffre (CNRS – UMR 6039 « Bases, corpus et Langage » (http://eprints.aidenligne-francais-universite.auf.org/19/1/pdf_Formation_Mayaffre_Alexandrie_dec09_.pdf)

[2] Frantext est le nom d’une base de données de textes français : textes littéraires et philosophiques, mais aussi scientifiques et techniques (environ 10%), développée et maintenue au sein de l’ATILF-CNRS . Elle a été créée autour d’un noyau de mille textes, dans les années 70, afin de fournir des exemples pour le Trésor de la Langue Française. Une fois le dictionnaire terminé, elle a continué à évoluer . Elle est régulièrement enrichie et comporte aujourd’hui près de 4000 références. Elle est la seule à proposer des recherches sur des textes qui vont de 1180 à 2009

Public ciblé

Ces deux journées de formation s’adressent à tous les enseignants-chercheurs exerçant dans les universités, les centres universitaires et les centres de recherche au niveau régional (ouest de l’Algérie), préparant un mémoire de magister ou une thèse de doctorat (classique/LMD) de langue française, options : sciences   du langage, didactique des langues et sciences  des textes littéraires. Les enseignants-chercheurs des autres disciplines peuvent également candidater et seront retenus dans la limite des places disponibles

Modalités de candidature

  • Envoyer en français  un CV scientifique (1 page), une  lettre de motivation  (1 page) et la dernière attestation d’inscription  à [algerie.logometrie@yahoo.fr]
  • Les candidats retenus doivent se munir d’un PC portable et d’un flash disque.
  • Les frais de restauration pour les intervenants et les participants sont assurés par le Laboratoire « Langue et communication »  durant les deux journées.
  • Les frais de déplacement et d’hébergement sont à  la charge des participants.

Le nombre des places disponibles est limité.

Calendrier

  • Dates d’envoi des dossiers de candidature à [algerie.logometrie@yahoo.fr] : Du 01 mars au 14 avril 2016

  • Etablissement de la liste des candidats retenus et de la liste d’attente : Le 15 avril 2016
  • Confirmation de participation : Le 20 avril 2016
  • Dates des journées d’étude : Le  mercredi 27  et le jeudi 28 avril 2016

Responsable scientifique

  • Dr. Benabdellah MEFLAH, Directeur du Laboratoire « Langue et communication »

Coordinateurs

  • Mohamed Boudaoud, Courriel : medboudaoud [at] yahoo [dot] fr
  • Abdelouahid Tiouidiouine, Courriel : wahid [dot] tioui_univ [at] yahoo [dot] fr

Comité d’organisation

  • Membres du projet CNEPRU (code projet: U00206220140011) : Dr Malika BENSEKAT, Nafissa ZEROUALI, Mounia OSMANI
  • Etudiants : Aicha ALIANE, Aoued CHEMLAL, Boulenouar YOUSFI, Aicha HABOUCHI

Programme prévisionnel

Le  mercredi 27 avril 2016           

  • 09h00 - 09h30 : Séance d’ouverture Allocutions de M.M .Les Directeurs du CUR (Dr. SEFIANE), de l’I.L.L (Dr. BRAHIMI) et du Laboratoire « Langue et communication »  (Dr. MEFLAH)     
  • 09h30 - 09h45 : Conférence plénière : « Usages de la logométrie en sciences  du langage, didactique des langues et sciences  des textes littéraires », Mohamed BOUDAOUD
  • 09h45-10h00 : Conférence plénière : « Synthèse des travaux en logométrie effectués par les étudiants du département de français du C.U. Ahmed Zabana de Relizane », Abdelouahid TIOUIDIOUINE
  • 10h00 -10h15 : Conférence plénière : « Synthèse des travaux en logométrie effectués par les enseignants du département de français du C.U. Ahmed Zabana de Relizane » , Dr.Malika BENSEKAT
  • 10h15 - 10h30 : Pause-café                        
  • 10h30 -12h30 : Séances  en atelier : Cours de démonstration (3)

Formateur Mohamed BOUDAOUD

Corpus : « Topographie idéale pour une agression caractérisée », roman de Rachid Boudjedra

Séance n°01

  1. Intégrer un texte dans la base
  2. Réaliser une concordance
  3. Créer une partition du corpus
  4. Constituer un groupe de formes
  5. Créer une carte des sections

12h30 -14h00 : Déjeuner                            

14h00 -16h00 : Reprise du cours de démonstration 

Séance n°02

  1. Créer un inventaire des segments répétés
  2. Calculer les spécificités d’une partie
  3. Réaliser une Analyse Factorielle des Correspondances
  4. Naviguer parmi les résultats
  5. Enregistrer des résultats dans le rapport

Le  jeudi 28 avril 2016    

08h00 -10h00 : Séances  en atelier : Cours d’application

Formateur : Mohamed BOUDAOUD

Corpus : « Le manuel scolaire de français de la  3ème AS »                        

Séance n°03

  1. Intégrer un texte dans la base
  2. Réaliser une concordance
  3. Créer une partition du corpus
  4. Constituer un groupe de formes

10h00 -10h15 : Pause-café         

10h15-12h15 : Reprise du cours d’application                  

Séance n°04

  1. Créer une carte des sections
  2. Créer un inventaire des segments répétés
  3. Calculer les spécificités d’une partie

12h15-14h00 : Déjeuner             

14h00-16h00 : Reprise  du cours d’application                  

Séance n°05

  1. Réaliser une Analyse Factorielle des Correspondances
  2. Naviguer parmi les résultats
  3. Enregistrer des résultats dans le rapport

16h00 -16h30 : Séance plénière : Synthèse des travaux et recommandations

  • Remise des attestations
  • Cérémonie  de clôture

Catégories

Lieux

  • Site de Bormadia, Centre universitaire de Relizane
    Relizane, Algérie (48000)

Dates

  • jeudi 14 avril 2016

Mots-clés

  • analyse informatisée, interprétation, discours, didactique, langue, Lexico3

Contacts

  • Abdelouahid Tiouidiouine
    courriel : wahid [dot] tioui_univ [at] yahoo [dot] fr
  • Mohamed Boudaoud
    courriel : medboudaoud [at] yahoo [dot] fr

Source de l'information

  • Abdelouahid Tiouidouine
    courriel : wahid [dot] tioui_univ [at] yahoo [dot] fr

Pour citer cette annonce

« Analyse informatisée et interprétation des discours en sciences du langage, didactique des langues et sciences des textes littéraires », Informations diverses, Calenda, Publié le vendredi 01 avril 2016, http://calenda.org/361416