HomeDe la source au texte intégral : atelier pratique sur l’utilisation de la reconnaissance automatique des caractères (ATR)

HomeDe la source au texte intégral : atelier pratique sur l’utilisation de la reconnaissance automatique des caractères (ATR)

*  *  *

Published on Thursday, May 25, 2023

Abstract

L’atelier pratique a pour but de former les chercheuses et les chercheurs à l’évaluation de leurs besoins et à la mise en pratique des techniques de reconnaissance automatique des caractères (ATR) sur des numérisations de sources textuelles pour leurs projets de recherche. Nous présenterons les principales étapes de travail à mettre en œuvre et les mettrons également en pratique. On abordera ainsi l’acquisition et l’optimisation des images, l’analyse de la mise en page, la reconnaissance et la correction du texte, le choix du format de sortie et la réutilisation des données produites. Outre la transmission de connaissances théoriques et pratiques dans le domaine de l’ATR, il s’agira également d’initier les chercheuses et les chercheurs à la logique des méthodes numériques, de leur présenter les supports méthodologiques existants, et de leur ouvrir ainsi de nouveaux horizons de recherche. La réutilisation des images, des textes et des méthodes sera au cœur du dispositif proposé.

Announcement

Présentation

De la source au texte intégral: atelier pratique sur l’utilisation de la reconnaissance automatique des caractères (ATR) - 7 et 8 septembre 2023

Qu’elles aient été photographiées lors d’une visite en dépôt d’archives ou trouvées sur le catalogue en ligne d’une institution patrimoniale, les images de sources textuelles constituent la base du travail scientifique pour de nombreux chercheurs et chercheuses en sciences humaines. Trouver, créer et collecter des images sur son ordinateur personnel ne reste néanmoins que la première étape du processus de recherche, et peut-être la plus simple maintenant qu’elle est facilitée par les progrès de la numérisation. L’étape suivante consiste à déchiffrer le texte figurant sur les images, à le lire ou à le transcrire, puis à l’enregistrer de manière à pouvoir travailler avec. Plus le nombre d’images est important et la transcription difficile, plus l’on souhaiterait que la technologie nous assiste dans le processus de transformation des images en textes exploitables par une machine. La bonne nouvelle, c’est que celle-ci existe et qu’elle est accessible non seulement aux grands projets, mais aussi aux chercheuses et chercheurs individuels, même pour celles et ceux qui ne sont pas familiers ou ne se sentent pas à l’aise avec les outils numériques.

L’appellation Automated Text Recognition (ATR) est utilisée de manière générique pour désigner la reconnaissance de textes imprimés par Optical Character Recognition (OCR) et la reconnaissance de textes manuscrits et tapuscrits par Handwritten Text Recognition (HTR).

À qui s’adresse l’atelier ?

Nous souhaitons, à travers cet atelier, mettre en contact des chercheuses et chercheurs issus de disciplines historiques originaires de pays francophones et germanophones. L’atelier s’adresse donc en premier lieu aux doctorantes et doctorants ainsi qu’aux post-doctorantes et post-doctorants de toutes les disciplines des sciences humaines qui travaillent sur des sources historiques allemandes et/ou françaises, quelle que soit l’époque. Les étudiantes et étudiants en master sont également les bienvenus si leur travail de master implique la conversion d’images en texte numérique, ainsi que les personnels d’appui à la recherche scientifique impliqués dans des projets mettant en œuvre ce type de corpus.

Modalités de participation

Veuillez envoyer votre candidature par e-mail à l’adresse DH@dhi-paris.fr avant le 26 juin 2023, accompagnée d’une lettre de motivation (2 pages maximum) contenant une brève esquisse de votre projet et de vos attentes concernant l’atelier, ainsi qu’un bref CV (1 page maximum), le tout dans un seul fichier PDF. Si votre candidature est sélectionnée, vous pourrez bénéficier d’une prise en charge forfaitaire de vos frais de voyage et d’hébergement dans la limite de 200 euros (pour l’Allemagne et la Suisse) et de 100 euros (pour la France) par personne.

Les langues de travail sont le français, l’allemand et l’anglais.

Organisation

  • Anne Baillot (Le Mans Université),
  • Floriane Chiffoleau (Inria-Paris/Le Mans Université),
  • Mareike König (IHA),
  • Pauline Spychala (IHA),
  • Olivier Richard (Univ. Fribourg)

Avec le soutien financier de : IHA, ALMAnaCH/INRIA, Département d’histoire de l’Université de Fribourg 

Places

  • 8 rue du Parc Royal, 75003 Paris
    Paris, France (75)

Event attendance modalities

Full on-site event


Date(s)

  • Monday, June 26, 2023

Keywords

  • humanité numérique, histoire numérique, htr, ocr, atr, reconnaissance de l'écriture manuscrite

Contact(s)

  • Mareike König
    courriel : mkoenig [at] dhi-paris [dot] fr

Information source

  • Hippolyte Souvay
    courriel : hsouvay [at] dhi-paris [dot] fr

License

CC0-1.0 This announcement is licensed under the terms of Creative Commons CC0 1.0 Universal.

To cite this announcement

« De la source au texte intégral : atelier pratique sur l’utilisation de la reconnaissance automatique des caractères (ATR) », Miscellaneous information, Calenda, Published on Thursday, May 25, 2023, https://doi.org/10.58079/1b8j

Archive this announcement

  • Google Agenda
  • iCal
Search OpenEdition Search

You will be redirected to OpenEdition Search