HomeReconnaissance automatique de caractères et extraction d’information spatiale à partir de sources anciennes numérisées
*  *  *

Published on Wednesday, November 26, 2025

Abstract

Cette journée est organisée dans le cadre de l’ANR OCEANLINKS. Il s’agit d’une journée d’échange et de présentations autour de l’utilisation des méthodes de reconnaissance optique de caractères manuscrits ou tapuscrits à des fins de recherche. La matinée s’intéresse au cas particulier de données issues des archives de l’enseignement supérieur et la recherche et l’après-midi porte sur l’extraction et le traitement de l’information spatiale extraites à partir de sources anciennes. Des protocoles de travail sont présentés et des chaînes de traitements ayant vocation à être réutilisées.

Announcement

Programme détaillé

Archives de l’enseignement supérieur et la recherche en France et en Belgique

  • 09h00-09h10 — Introduction
  • 09h10-09h45 — Pierre Verschueren (Centre Lucien-Febvre, Université Marie et Louis Pasteur). Les doctorats ès lettres et ès sciences : numérisation des thèses et prosopographie des docteur-es (XIX-XXe siècles).
  • 09h45-10h20 — Viera Rebolledo-Dhuin (Université Paris-Est Créteil, Centre de Recherche en Histoire européenne comparée). Le développement de la base PRET19 à partir de l’HTRisation des registres de prêt de bibliothèques universitaires parisiennes au XIXe siècle : conception, construction, alimentation.
  • Pause
  • 10h30-11h05 — Matthieu Pichon (ULB, Ratio DH). La numérisation est-elle encore un problème ? Réflexions autour de l’OCR du corpus des thèses de l’Université Libre de Bruxelles.
  • 11h05-11h40 — Marion Maisonobe (CNRS, Géographie-cités). Le projet OCEANLINKS : des sources hétérogènes pour reconstituer les échanges savants entre stations marines.
  • 11h40-12h00 — Océane Valencia (Sorbonne Université). Cartographie et état des traitements des fonds des stations marines de Sorbonne Université.

Défis et bonnes pratiques pour l’extraction d’information spatiale depuis des sources anciennes numérisées

  • 14h00-14h35 — Carmen Brando (EHESS, Plateforme géomatique, CRH). Travaux collectifs de l’ANR TopUrbi : méthodes et impasses dans le travail textuel et cartographique du dictionnaire historique d’Alcedo.
  • 14h35-15h10 — Nathalie Abadie (LASTIG, Univ. Eiffel, IGN-ENSG). Des annuaires du commerce parisien du 19ème siècle à des graphes de connaissances géohistoriques professionnels.
  • 15h10-15h45 — Solenn Tual (LASTIG, Univ. Eiffel, IGN-ENSG). Interprétation sémantique de tables historiques : des sources anciennes aux graphes de connaissances.
  • Pause
  • 16h00-16h35 — Joseph Chazalon (Laboratoire de recherche de l’EPITA). Des sources sérielles aux données structurées pour les humanités numériques : présentation de l’écosystème Mezanno.
  • 16h35-17h10 — Thierry Paquet (LITIS, Université de Rouen Normandie). Pop Pop Pop… : Apport des modèles génératifs multimodaux dans les projets de démographie historique.
  • 17h10-17h15 — Discussion et conclusion de la journée

Places

  • Salle 100 - Centre des Colloques, Campus Condorcet
    Aubervilliers, France (93)

Event attendance modalities

Full on-site event


Date(s)

  • Wednesday, December 10, 2025

Keywords

  • OCR, HTR, archive, enseignement supérieur, graphe de connaissances géohistoriques, numérisation

Information source

  • Marion Maisonobe
    courriel : marion [dot] maisonobe [at] cnrs [dot] fr

License

CC0-1.0 This announcement is licensed under the terms of Creative Commons CC0 1.0 Universal.

To cite this announcement

« Reconnaissance automatique de caractères et extraction d’information spatiale à partir de sources anciennes numérisées », Study days, Calenda, Published on Wednesday, November 26, 2025, https://doi.org/10.58079/1583u

Archive this announcement

  • Google Agenda
  • iCal
Search OpenEdition Search

You will be redirected to OpenEdition Search