AccueilMatérialités des textes

Matérialités des textes

The Materiality of Texts

Problèmes de saisie et de traitement des données graphiques

Encoding and exploiting graphical data

*  *  *

Publié le lundi 23 janvier 2012 par Claire Ducournau

Résumé

Que ce soit à des fins de recherche ou d'édition, l'acquisition d'un texte comportant d'importantes fluctuations graphiques ou transcrivant un idiome non standardisé soulève de multiples questions. La part des contraintes liées aux supports matériels mises en œuvre a, notamment, été peu prise en compte dans l'analyse de la variabilité. Idéalement, une saisie unique, donnant lieu à un texte informatique de référence, devrait permettre de remplir ces deux objectifs. Dans la pratique, quels que soient la réflexion et le soin apportés à ce travail de mise en machine du texte, il y a toujours un décalage entre le texte source et sa version en fac-similé sur ordinateur. Ce constat nous amène à de multiples interrogations et défis : part des facteurs matériels dans la variabilité d'un texte, supprimer le décalage entre le texte source et sa « traduction » informatique ; créer un texte informatique de référence unique pour la recherche et l'édition ; servir à différentes disciplines des SHS.

Annonce

Présentation

Cette journée fait partie du Séminaire commun Paris 3 - CNRS intitulé « Pratiques langagières : oral et écrit d'hier et d'aujourd'hui ». Il est organisé par Gabriella Parussa (Paris 3), Darwin Smith et Fabrice Jejcic (CNRS-LAMOP), avec la participation de Susan Baddeley (Université de Versailles-Saint-Quentin).

Que ce soit à des fins de recherche ou à des fins d'édition, l'acquisition d'un texte comportant d'importantes fluctuations graphiques ou transcrivant un idiome non standardisé soulève de multiples questions. La part des contraintes liées aux supports matériels mises en œuvre a, notamment, été peu prise en compte dans l’analyse de la variabilité. Idéalement, une saisie unique, donnant lieu à un texte informatique de référence, devrait permettre de remplir ces deux objectifs. Dans la pratique, quels que soient la réflexion et le soin apportés à ce travail de mise en machine du texte, il y a toujours un décalage plus ou moins important entre le texte source et sa version en fac-simulé sur ordinateur.

Ce constat nous amène à de multiples interrogations :

  1. Quelle est la part des facteurs matériels dans la variabilité d’un texte, et dans quelle mesure est-il utile d’en tenir compte ?
  2. Dans quelle mesure le décalage entre le texte source et sa « traduction » informatique peut-il être supprimé ?
  3. Est-il possible de créer un texte informatique de référence unique pour la recherche et l'édition ?
  4. Un tel corpus peut-il servir de source à différentes disciplines des Sciences humaines et sociales ?

Les interventions de la journée tenteront d'apporter des éléments de réponse et/ou de réflexion à ces interrogations, mais aussi à d'autres questionnements proches sur la constitution de corpus de données graphiques et sur leur exploitation.

Programme

Matinée

Susan BADDELEY, Fabrice JEJCIC (Université de Versailles - Saint-Quentin / LAMOP-CNRS)

« Aspects matériels des textes et leur prise en compte pour l'analyse de données linguistiques »

Valentin VYDRIN (LLACAN-CNRS)

« Problèmes de numérisation des textes en langues mandingues précédant le traitement automatique »

Après-midi

Dominique STUTZMANN (IRHT-CNRS) :

« Étudier la matérialité du texte en-deçà du signe alphabétique : décrire l'écriture du Moyen Âge »

Benoît GRÉVIN (LAMOP-CNRS) :

« Dans les entrelacs du Coran : problèmes de transcription des éléments alphabétiques et non-alphabétiques d’un ms. « judéo-arabe » (Vat. Ebr. 357, fol. 51-156) »

Anja VOESTE (Université de Giessen) :

« Professionalization in 16th-century printing shops and its impact on German spelling »,

communication en anglais, texte support en français (La professionnalisation des ateliers d'imprimerie et son impact sur l'orthographe allemande au XVIe siècle)

Lieux

  • 7 rue Guy Môquet
    Villejuif, France

Dates

  • mercredi 25 janvier 2012

Mots-clés

  • humanités numériques, digital humanities, édition savante, scholarly edition, philologie, philology, linguistique, linguistics, paléographie, palaeography

Contacts

  • Fabrice Jejcic
    courriel : jejcic [at] vjf [dot] cnrs [dot] fr

Source de l'information

  • Dominique Stutzmann
    courriel : dominique [dot] stutzmann [at] irht [dot] cnrs [dot] fr

Pour citer cette annonce

« Matérialités des textes », Journée d'étude, Calenda, Publié le lundi 23 janvier 2012, http://calenda.org/206979