Calenda - Le calendrier des lettres et sciences humaines et sociales

Publication de données archéologiques dans le web de données

Publication of archeological data in the kinked Open Data

*  *  *

Publié le lundi 04 décembre 2017 par Céline Guilleux

Résumé

Ce projet post-doctorat international d’un an a pour objectif la publication des données archéologiques dans le web des données à partir des systèmes d’informations du laboratoire archéologie et territoires de l’UMR Cités, territoires, environnement et sociétés (CITERES), en collaboration avec le Labortaoire d'informatique (LI) et le Centre d'études supérieures sur la Renaissance (CESR) pour l’ARD Intelligence des patrimoines (IPat). Il bénéficiera de l’insertion dans le réseau national du consortium « Mémoire des archéologues et des sites archéologiques » (MASA) de la TGIR Huma-Num. L’enjeu de ce post-doctorat est de contribuer à l’émergence du domaine « patrimoine » dans les données interconnectées du web.

The aim of this international one year long post-doctoral project is to generalize the LAT’s archaeological data publication in the Linked Open Data (LOD), as a proof of concept for the French archeological community. This interdisciplinary project is conducted in collaboration with the computer science laboratory (LI) and the center for the Renaissance study (CESR) of the University of Tours, which leads the Intelligence des Patrimoines (I-Pat) program of the Centre-Val-de-Loire Region. It will benefit from the inclusion in the national network of the consortium Mémoire des Archéologues et des Sites Archéologiques (MASA) of the TGIR Huma-Num. More generally, this post-doctorate project should contribute to the emergence of the "Heritage" domain in the Linked Open Data cloud.

Annonce

Poste

Unité de recherche de rattachement : UMR 7324 CITERES–Laboratoire Archéologie et Territoires, Université de Tours, CNRS.

En collaboration avec :

  • EA 6300 Laboratoire d’Informatique, Université de Tours.
  • Intelligence des Patrimoines, UMR 7323 CESR, Université de Tours, CNRS.

Lieu : Tours (France)

Durée : 12 mois (2018-2019)

Rémunération : 2200€ net/mois

Objectifs

Ce projet post-doctorat international d’un an a pour objectif la publication des données archéologiques dans le web des données à partir des systèmes d’informations du Laboratoire Archéologie et Territoires de l’UMR CITERES, en collaboration avec le LI et le CESR pour l’ARD Intelligence des patrimoines (IPat). Il s’inscrit au cœur de la plate-forme numérique d’IPat. , l’enjeu de ce post-doctorat est de contribuer à l’émergence du domaine « patrimoine » dans les données interconnectées du web.

Dans la communauté archéologique, on constate qu’une masse importante de données reste difficilement accessible et risque d’être perdue. Ce n’est pas fondamentalement différent des autres disciplines des SHS. En revanche, cela correspond à une originalité propre à la pratique archéologique qui ne permet pas le renouvellement de l’expérience une fois la fouille effectuée et donne, de ce fait, une valeur accrue aux archives de fouilles et une responsabilité supplémentaire aux archéologues. La préservation de cette masse de données scientifiques en la rendant accessible est fondamentale pour la connaissance des patrimoines que ces archives documentent et pour la mémoire de la discipline elle-même dont la publication et le partage des données seront inéluctablement numériques.

Le programme d’archéologie urbaine initié à Tours dès 1970 constitue un cas emblématique en offrant une documentation homogène dont la structure a été conservée lors de l’informatisation du système d’information. Pour l’ouverture des données sur le web sémantique, une notation à cinq étoiles (Five stars Linked Open Data) a été mise en place par Berners-Lee en 2010 permettant d’évaluer la qualité d’un jeu de données au regard de son accessibilité sur le web des données. Cette qualité s’évalue par l’accessibilité (en ligne), la structuration, l’utilisation de formats non-propriétaires et répondant à un standard et enfin sur l’interopérabilité. Aujourd’hui, CITERES-LAT dispose de plusieurs bases de données chacune à un stade différent de développement vers l’interopérabilité selon le moment où elles ont été conçues. Notre objectif n’est pas de les homogénéiser mais de les faire dialoguer, entre elles et avec d’autres, de manière à pouvoir les interroger ensemble sans modifier les habitudes des utilisateurs.

La première étape de ce processus consiste à aligner le contenu de ces bases de données avec des vocabulaires partagés et normés (PACTOLS, ensemble de thésaurus multilingues ISO 25964-1:2011). L’étape suivante est le passage à un niveau supérieur d’abstraction afin de permettre l’interrogation croisée de systèmes dont la granularité des entités et des descripteurs sont différents. Pour mettre en correspondance les structures de données et les terminologies utilisées nous faisons appel au CIDOC-CRM (ISO 21127:2014) qui est l’ontologie de domaine pour les données patrimoniales, développée par le CRM Special Interest Group coordonné par l’équipe ICS-FORTH à Héraklion avec laquelle une collaboration est engagée. Ensuite, le choix effectué, fondé sur l’expertise de Béatrice Markhoff au LI en collaboration avec l’Université de Bozen-Bolzano (Italie), est de mettre en place une architecture logicielle, composée de plusieurs briques, pour une interrogation dynamique des systèmes d’information existants via l’ontologie plutôt que de stocker l’ensemble des triplets RDF de manière statique dans des entrepôts de données (triplestore).

Les travaux déjà effectués ont démontré la faisabilité de cette architecture à partir de l’exposition du système ArSol (Archives du Sol) de CITERES-LAT. Cette première preuve de concept constitue la base de ce projet dont l’objectif est bien entendu de rendre interopérable l’ensemble de nos systèmes d’information par ce moyen mais également de faire la démonstration de l’interopérabilité auprès de la communauté archéologique en montrant comment plusieurs systèmes de formats, de structures et de granularités différents peuvent être interrogés de manière croisée depuis un niveau ontologique.

Contribution de la thématique au rayonnement, partenariats et réseaux scientifiques aux échelles nationale et internationale

Ce projet permettra de donner de l’ampleur aux expériences menées en les portant aux niveaux des infrastructures nationales et européennes, en place ou en cours de création, et en créant des sources de données archéologiques dans le graphe du web sémantique.

L’ambition est de démontrer que l’exposition sur le web des données d’informations structurées et interprétées permet d’envisager leur utilisation et leur réutilisation en ouvrant de nouvelles perspectives de recherche. Au-delà, l’enjeu porte sur l’articulation des publications scientifiques avec les données en explorant les nouvelles perspectives qu’offre la mise en œuvre des inférences ontologiques.

Le post-doctorant contribuera à la structuration de la recherche régionale puisqu’il participera à la plate-forme de données hétérogènes en cours de constitution d’Intelligence des Patrimoine. Il bénéficiera de l’insertion dans le réseau national du consortium Mémoire des Archéologues et des Sites Archéologiques (MASA) de la TGIR Huma-Num, coordonné par X. Rodier (CITERES-LAT) pour la MSH Val de Loire de 2017 à 2020. En outre, le projet apportera de la matière à deux projets européens : ARIADNE, Advanced Research Infrastructure for Archaeological Dataset Networking in Europe (7e PCRD), en alimentant la plate-forme (http://portal.ariadne-infrastructure.eu/) par les données publiées, et PARTHENOS, Pooling Activities, Resources and Tools for Heritage E-research Networking, Optimization and Synergies (H2020), auxquels le consortium MASA contribue via la TGIR Huma-Num pour la mise en œuvre du CIDOC-CRM à l’échelle de données de fouilles archéologiques.

Enfin, ce projet s’insère également dans l’action COST Saving European Archaeology from the Digital Dark Age, SEADDA, soumise en septembre à l’Union Européenne.

Encadrement

Le post-doctorant sera accueilli à CITERES-LAT dans les locaux de la MSH Val de Loire où il disposera d’un bureau et d’un ordinateur équipé des logiciels nécessaires. Il travaillera en collaboration avec les membres du laboratoire qui développent, gèrent et publient les systèmes d’information : Philippe Husi (IR CNRS, HDR), Olivier Marlet (IE CNRS), Xavier Rodier (IR CNRS, HDR). Il bénéficiera des travaux réalisés à partir du système d’information ArSol en collaboration avec Béatrice Markhoff (MCF HDR) du LI pour la publication d’ArSol dans le web des données. Enfin il veillera à l’adéquation de ces travaux avec la plate-forme numérique d’Intelligence des patrimoines coordonnée par Perrine Thuringer (IR IPat).

Modalités de candidature 

Les candidatures sont à envoyer à xavier.rodier@univ-tours.fr

avant le 1er janvier 2018 minuit par courriel avec fichiers joints.

Le dossier devra comporter :

  • Une lettre de motivation
  • Un curriculum vitae avec liste de publications
  • Un résumé long de la thèse

Sélection

Les candidatures seront examinées par

  • Béatrice Markhoff (MCF, HDR, EA6300 LI, Université de Tours),
  • Olivier Marlet (IE CNRS, UMR7324 CITERES, Université de Tours/CNRS),
  • Xavier Rodier (IR CNRS, HDR, , UMR7324 CITERES, Université de Tours/CNRS),
  • Perrine Thuringer (IR IPat, UMR7323 CESR, Université de Tours/CNRS)

Veuillez vous adresser à Xavier Rodier pour tout renseignement complémentaire.

Post-doctoral offer

Research unit: UMR 7324 CITERES-Laboratoire Archéologie et Territoires (LAT), University of Tours, CNRS.

In collaboration with:

  • EA 6300 Laboratoire d’Informatique (LI), University of Tours.
  • Intelligence des Patrimoines, UMR 7323 CESR, University of Tours, CNRS.

Location: Tours (France)

Duration: 12 months (2018-2019)

Remuneration: 2200€ / month (net pay)

Objectives

The aim of this international one year long post-doctoral project is to generalize the LAT’s archaeological data publication in the Linked Open Data (LOD), as a proof of concept for the French archeological community. This interdisciplinary project is conducted in collaboration with the computer science laboratory (LI) and the center for the Renaissance study (CESR) of the University of Tours, which leads the Intelligence des Patrimoines (I-Pat) program of the Centre-Val-de-Loire Region. This project achievements are intended to feed the I-Pat's digital platform. More generally, this post-doctorate project should contribute to the emergence of the "Heritage" domain in the Linked Open Data cloud.

In the archaeological community, it is noted that a significant amount of data remains difficult to access and run the risk of being lost. It is not fundamentally different from the other disciplines of the Humanities and Social Sciences. Besides, an originality of the archaeological practice is that it does not allow for the renewal of the experiment once the excavation has been carried out, and thus, the excavation archives value is increased, and archaeologists have even more responsibility when managing their data. The conservation of this mass of scientific data, by making it accessible, is fundamental for the knowledge of the heritages that these archives document, and for the memory of the discipline itself. Archeological data publication and sharing will inevitably be digital.

The program of urban archaeology initiated in Tours in 1970 is emblematic, as it offers a homogeneous documentation, the structure of which was preserved during the information system digitizing. The aim is to open it to the LOD. Published data in the LOD is characterized by a five-star rating (Five stars Linked Open Data), set up by Berners-Lee in 2010 to assess the quality of a data set in terms of accessibility and usability on the semantic web level. This scale goes from accessibility (online), structuring, the use of non-proprietary and standard formats, to data interlinking (interoperability). Today, CITERES-LAT has several databases, each at a different stage of development towards interoperability, depending on when they were designed. Our goal is not to homogenize them, but to make them interact, with each other and with others, so that they can be queried together without altering their initial users' habits.

The first step in this process is to align the content of these databases with shared and standardized vocabularies (PACTOLS, multilingual thesaurus set ISO 25964-1:2011). The next step is to move to a higher level of abstraction in order to allow cross-examination of systems with different granularity of entities and descriptors. To match the used data structures and terminology, we use CIDOC-CRM (ISO 21127:2014), which is the domain ontology for heritage data, developed by the CRM Special Interest Group, chair by the ICS-FORTH team in Heraklion with which a collaboration is being undertaken. Then, based on the expertise of Béatrice Markhoff (LI), in collaboration with the University of Bozen-Bolzano (Italy), the choice we made is to set up a software architecture, composed of several bricks, for a dynamic interrogation of the existing information systems via the ontology (CIDOC CRM). We do not transform, extract and load our legacy data into data warehouses (triplestores).

The work already carried out has demonstrated the feasibility of this architecture based on the exhibition of the ArSol system (Archives du Sol http://arsol.univ-tours.fr/ and http://citeres.univ-tours.fr/spip.php?article505). This first proof of concept forms the basis for this project, the objective of which is of course to make all our information systems interoperable by this means, but also to demonstrate interoperability to the archaeological community by showing how several systems of different formats, structures and granularities can be cross-examined from an ontological level.

Contribution of the theme to national and international outreach, partnerships and scientific networks

This project will make it possible to extend the scope of the already carried out experiments, by bringing them up to national and European infrastructure levels, in place or in the process of being set up, and by creating archaeological data sources in the Linked Open Data cloud.

The ambition is to demonstrate that the web exhibition of structured and interpreted information makes it possible to envisage their use and reuse by opening up new research perspectives. Beyond that, the challenge is to link scientific publications with data, by exploring the new perspectives offered by ontological inferences.

The post-doctoral fellow will contribute to the regional research by participating in the heterogeneous data platform currently being built by Program Intelligence des patrimoines (I-Pat). He or she will benefit from the inclusion in the national network of the consortium Mémoire des Archéologues et des Sites Archéologiques (MASA) of the TGIR Huma-Num, led by X. Rodier (CITERES-LAT) for the MSH Val de Loire from 2017 to 2020. In addition, his or her achievements will contribute to two European projects: ARIADNE, Advanced Research Infrastructure for Archaeological Dataset Networking in Europe (7th FP7), by supplying its portal (http://portal.ariadne-infrastructure.eu/) with the published data, and PARTHENOS, Pooling Activities, Resources and Tools for Heritage E-research Networking, Optimization and Synergies (H2020), to which the MASA consortium contributes via the TGIR Huma-Num.

Finally, this project is also part of the COST Saving European Archaeology from the Digital Dark Age project, SEADDA, submitted to the European Union in September 2017.

Supervision

The post-doctoral researcher will be welcomed in CITERES-LAT at the MSH Val de Loire where he or she will have an office and a computer equipped with the necessary softwares. He or she will work in collaboration with the members of the laboratory who develop, manage and publish information systems: Philippe Husi (IR CNRS, HDR), Olivier Marlet (IE CNRS), Xavier Rodier (IR CNRS, HDR). He or she will benefit from the work carried out using the ArSol information system in collaboration with Béatrice Markhoff (MCF HDR) from LI, for the publication of ArSol in the Linked Open Data. Finally, he or she will ensure that these works are in line with the digital platform for Intelligence des Patrimoine,s coordinated by Perrine Thuringer (IR I-Pat).

Applications must be sent to xavier.rodier@univ-tours.fr

before midnight on 1st January 2018, by e-mail with attached files.

Application guidelines

The files must include

  • A cover letter
  • A curriculum vitae with a list of publications
  • An extended abstract of the PhD thesis

Selection

Applications will be reviewed by

  • Béatrice Markhoff (MCF, HDR, EA6300 LI, Université de Tours),
  • Olivier Marlet (IE CNRS, UMR7324 CITERES, Université de Tours/CNRS),
  • Xavier Rodier (IR CNRS, HDR, , UMR7324 CITERES, Université de Tours/CNRS),
  • Perrine Thuringer (IR IPat, UMR7323 CESR, Université de Tours/CNRS)

Please contact Xavier Rodier for further information.

Lieux

  • Acticampus 1 - 1er étage - 40 rue James Watt
    Tours, France (37)

Dates

  • lundi 01 janvier 2018

Mots-clés

  • web des données, interopérabilité, archéologie

Contacts

  • Xavier Rodier
    courriel : xavier [dot] rodier [at] univ-tours [dot] fr

Source de l'information

  • Xavier Rodier
    courriel : xavier [dot] rodier [at] univ-tours [dot] fr

Pour citer cette annonce

« Publication de données archéologiques dans le web de données », Bourse, prix et emploi, Calenda, Publié le lundi 04 décembre 2017, https://calenda.org/422953

Archiver cette annonce

  • Google Agenda
  • iCal