AccueilFormations en textométrie pour historiens

Formations en textométrie pour historiens

Textometric training for historians

*  *  *

Publié le lundi 14 décembre 2015 par Elsa Zotian

Résumé

Le principe de la lexicométrie est de comparer entre eux des textes réunis au sein d’un corpus afin de répondre à une problématique. La comparaison s’établit sur la base d’un comptage des unités de sens qui composent le corpus ou de différentes échelles d’analyse thématiques, chronologique, géographiques… Cela n’est possible qu’avec une approche automatique et quantitative. Lorsqu’il aborde la lexicométrie, l’historien touche à la fois à une méthode issue de la linguistique, à une pratique de l'informatique, au questionnement de son rapport aux sources et à la manière dont il écrit l’histoire. C'est pourquoi la formation s’attache à proposer aux étudiants d'articuler une culture de la lexicométrie historique avec l'acquisition d'un ensemble de techniques accompagnées d'une explication des outils statistiques nécessaires.

Annonce

Présentation

Le principe de la lexicométrie est de comparer entre eux des textes réunis au sein d’un corpus afin de répondre à une problématique. La comparaison s’établit sur la base d’un comptage des unités de sens qui composent le corpus ou de différentes échelles d’analyse thématiques, chronologique, géographiques… Cela n’est possible qu’avec une approche automatique et quantitative.

Lorsqu’il aborde la lexicométrie, l’historien touche à la fois à une méthode issue de la linguistique, à une pratique de l'informatique, au questionnement de son rapport aux sources et à la manière dont il écrit l’histoire. C'est pourquoi la formation s’attache à proposer aux étudiants d'articuler une culture de la lexicométrie historique avec l'acquisition d'un ensemble de techniques accompagnées d'une explication des outils statistiques nécessaires.

Parmi les différents traitements présentés, une attention particulière est portée à la numérisation et la constitution d’un corpus textuel, ainsi qu'a l'étiquetage des textes et la lemmatisation des formes. Les concordances, l'analyse temporelle, la recherche des segments répétés sont abordées, comme les cooccurrences et les poly-cooccurrences. Les outils statistiques mobilisés sont « classiques » : analyses factorielles, méthodes de classification, etc. Enfin, quelques logiciels sont présentés : Lexico 3, Coocs2, TreeTagger, TXM et IraMuTeQ.

Les matinées seront consacrées à des conférences de manière à exposer les notions théoriques préalables aux formations pratiques, qui auront lieu les après-midis en salle informatique afin de proposer aux participants des exercices concrets sur des jeux de données historiques.

Toute la formation se déroule sur le site Sorbonne. Les conférences du matin ont lieu en salle Perroy et les travaux pratiques de l'après-midi dans les salles informatiques 01 et 02 (accessibles par l'entrée du 14 rue Cujas).

Inscription et modalités de sélection

L'inscription est obligatoire sur http://pireh-dev.univ-paris1.fr/inscriptions/index.php/882624/lang-fr

avant le 03/01/2016

La formation est ouverte à tous les chercheurs intéressés à partir d'un niveau doctorat, les candidatures sont retenues par ordre d'arrivée dans la limite des places disponibles (20 places).

La priorité est donnée aux doctorants en histoire de l'Université Paris 1, mais les inscriptions extérieures sont les bienvenues.

Informations supplémentaires sur http://www.univ-paris1.fr/axe-de-recherche/pole-informatique-de-recherche-et-denseignement-en-histoire/doctorat/

Programme

04/01/2016 La textométrie pour l’historien : aspects théoriques et pratiques

Conférence de (10h-12h, salle Perroy)

Atelier (12h-13h, salle informatique 01)

Présentation et installation des logiciels utilisés durant la formation

TP : (14h-17h, salle informatique 01)

  • Numériser un corpus de textes

  • Nettoyer des textes en utilisant les expressions rationnelles

  • Importer les données dans un logiciel de textométrie

05/01/2016 La linguistique de corpus

Conférence (10h-12h)

TP (13h-16h, salle informatique 01)

  • Utilisation et évaluation des partitions

  • Etude du dictionnaire des formes

 06/01/2015 Exploration des textes et mesures du langage

Conférence   (10h-12h)

TP (13h-16h, salle informatique 01) :

  • Phrases, mots, formes et occurences

  • Modèle statistique (loi hypergéométrique, spécificités)

  • Usage des formes (rafales, densité textuelle, segments répétés)

 07/01/2016 Les enjeux de la lemmatisation

Conférence  (10h-12h)

TP (13-16h, salle informatique 01)

  • Utilisation de Treetagger, CQP/CQL, CWB

08/01/2016 Le système des mots

Conférence (10h-12h) :

De la cooccurrences aux trames

TP  (13h-16h, salle informatique 01)

  • Analyse des cooccurences (AFC des cooccurents dans un corpus, polycooccurences, trames)

Lieux

  • 14 rue Cujas
    Paris, France (75005)

Dates

  • dimanche 03 janvier 2016

Mots-clés

  • textométrie, statistique, analyses factorielles, méthodes de classification, corpus

Contacts

  • Stéphane Lamassé
    courriel : stephane [dot] lamasse [at] univ-paris1 [dot] fr
  • Léo Dumont
    courriel : leo [dot] dumont [at] univ-paris1 [dot] fr

URLS de référence

Source de l'information

  • Léo Dumont
    courriel : leo [dot] dumont [at] univ-paris1 [dot] fr

Pour citer cette annonce

« Formations en textométrie pour historiens », Informations diverses, Calenda, Publié le lundi 14 décembre 2015, http://calenda.org/350084

Archiver cette annonce

  • Google Agenda
  • iCal

À lire sur le même thème