InicioFormations en textométrie pour historiens

InicioFormations en textométrie pour historiens

Formations en textométrie pour historiens

Textometric training for historians

*  *  *

Publicado el lunes 14 de diciembre de 2015

Resumen

Le principe de la lexicométrie est de comparer entre eux des textes réunis au sein d’un corpus afin de répondre à une problématique. La comparaison s’établit sur la base d’un comptage des unités de sens qui composent le corpus ou de différentes échelles d’analyse thématiques, chronologique, géographiques… Cela n’est possible qu’avec une approche automatique et quantitative. Lorsqu’il aborde la lexicométrie, l’historien touche à la fois à une méthode issue de la linguistique, à une pratique de l'informatique, au questionnement de son rapport aux sources et à la manière dont il écrit l’histoire. C'est pourquoi la formation s’attache à proposer aux étudiants d'articuler une culture de la lexicométrie historique avec l'acquisition d'un ensemble de techniques accompagnées d'une explication des outils statistiques nécessaires.

Anuncio

Présentation

Le principe de la lexicométrie est de comparer entre eux des textes réunis au sein d’un corpus afin de répondre à une problématique. La comparaison s’établit sur la base d’un comptage des unités de sens qui composent le corpus ou de différentes échelles d’analyse thématiques, chronologique, géographiques… Cela n’est possible qu’avec une approche automatique et quantitative.

Lorsqu’il aborde la lexicométrie, l’historien touche à la fois à une méthode issue de la linguistique, à une pratique de l'informatique, au questionnement de son rapport aux sources et à la manière dont il écrit l’histoire. C'est pourquoi la formation s’attache à proposer aux étudiants d'articuler une culture de la lexicométrie historique avec l'acquisition d'un ensemble de techniques accompagnées d'une explication des outils statistiques nécessaires.

Parmi les différents traitements présentés, une attention particulière est portée à la numérisation et la constitution d’un corpus textuel, ainsi qu'a l'étiquetage des textes et la lemmatisation des formes. Les concordances, l'analyse temporelle, la recherche des segments répétés sont abordées, comme les cooccurrences et les poly-cooccurrences. Les outils statistiques mobilisés sont « classiques » : analyses factorielles, méthodes de classification, etc. Enfin, quelques logiciels sont présentés : Lexico 3, Coocs2, TreeTagger, TXM et IraMuTeQ.

Les matinées seront consacrées à des conférences de manière à exposer les notions théoriques préalables aux formations pratiques, qui auront lieu les après-midis en salle informatique afin de proposer aux participants des exercices concrets sur des jeux de données historiques.

Toute la formation se déroule sur le site Sorbonne. Les conférences du matin ont lieu en salle Perroy et les travaux pratiques de l'après-midi dans les salles informatiques 01 et 02 (accessibles par l'entrée du 14 rue Cujas).

Inscription et modalités de sélection

L'inscription est obligatoire sur http://pireh-dev.univ-paris1.fr/inscriptions/index.php/882624/lang-fr

avant le 03/01/2016

La formation est ouverte à tous les chercheurs intéressés à partir d'un niveau doctorat, les candidatures sont retenues par ordre d'arrivée dans la limite des places disponibles (20 places).

La priorité est donnée aux doctorants en histoire de l'Université Paris 1, mais les inscriptions extérieures sont les bienvenues.

Informations supplémentaires sur http://www.univ-paris1.fr/axe-de-recherche/pole-informatique-de-recherche-et-denseignement-en-histoire/doctorat/

Programme

04/01/2016 La textométrie pour l’historien : aspects théoriques et pratiques

Conférence de (10h-12h, salle Perroy)

Atelier (12h-13h, salle informatique 01)

Présentation et installation des logiciels utilisés durant la formation

TP : (14h-17h, salle informatique 01)

  • Numériser un corpus de textes

  • Nettoyer des textes en utilisant les expressions rationnelles

  • Importer les données dans un logiciel de textométrie

05/01/2016 La linguistique de corpus

Conférence (10h-12h)

TP (13h-16h, salle informatique 01)

  • Utilisation et évaluation des partitions

  • Etude du dictionnaire des formes

 06/01/2015 Exploration des textes et mesures du langage

Conférence   (10h-12h)

TP (13h-16h, salle informatique 01) :

  • Phrases, mots, formes et occurences

  • Modèle statistique (loi hypergéométrique, spécificités)

  • Usage des formes (rafales, densité textuelle, segments répétés)

 07/01/2016 Les enjeux de la lemmatisation

Conférence  (10h-12h)

TP (13-16h, salle informatique 01)

  • Utilisation de Treetagger, CQP/CQL, CWB

08/01/2016 Le système des mots

Conférence (10h-12h) :

De la cooccurrences aux trames

TP  (13h-16h, salle informatique 01)

  • Analyse des cooccurences (AFC des cooccurents dans un corpus, polycooccurences, trames)

Lugares

  • 14 rue Cujas
    París, Francia (75005)

Fecha(s)

  • domingo 03 de enero de 2016

Palabras claves

  • textométrie, statistique, analyses factorielles, méthodes de classification, corpus

Contactos

  • Stéphane Lamassé
    courriel : stephane [dot] lamasse [at] univ-paris1 [dot] fr
  • Léo Dumont
    courriel : leo [dot] dumont [at] univ-paris1 [dot] fr

URLs de referencia

Fuente de la información

  • Léo Dumont
    courriel : leo [dot] dumont [at] univ-paris1 [dot] fr

Licencia

CC0-1.0 Este anuncio está sujeto a la licencia Creative Commons CC0 1.0 Universal.

Para citar este anuncio

« Formations en textométrie pour historiens », Informaciónes varias , Calenda, Publicado el lunes 14 de diciembre de 2015, https://doi.org/10.58079/tz5

Archivar este anuncio

  • Google Agenda
  • iCal
Buscar en OpenEdition Search

Se le redirigirá a OpenEdition Search