AccueilConstituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse

Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse

Building Modern Research Corpora: the Evolution of Web Archiving and Analytics

Conférence d'ouverture de l'assemblée générale du consortium international pour la préservation de l'internet

Opening conference of the General Assembly of the International Internet Preservation Consortium

*  *  *

Publié le vendredi 16 mai 2014 par Elsa Zotian

Résumé

Pendant cinq jours, la BnF accueille les experts mondiaux de l’archivage du web, en collaboration avec l’Institut national de l’audiovisuel (INA) et l’Internet Memory Foundation (IMF). La semaine s’ouvre avec une conférence (lundi 19 mai) destinée aux chercheurs, archivistes et bibliothécaires spécialistes d’internet.

Annonce

Présentation

Pendant cinq jours, la BnF accueille les experts mondiaux de l’archivage du web, en collaboration avec l’Institut national de l’audiovisuel (INA) et l’Internet Memory Foundation (IMF). La semaine s’ouvre avec une conférence (lundi 19 mai) et se termine par des ateliers (jeudi 22 après-midi et vendredi 23 mai) destinés aux chercheurs, archivistes et bibliothécaires spécialistes d’internet. Les autres journées sont consacrées à l’assemblée générale du consortium international pour la préservation de l’internet et sont réservées à ses membres. L’IIPC regroupe 48 institutions patrimoniales et de recherche, dont l'INA et l'IMF, ainsi que de nombreuses bibliothèques nationales et Internet Archive.

Programme

Welcome

Keynote


The role of the web Observatory in web archiving and analytics (Univ. of Southampton)

Session: Web archives needs and projects across time and social sciences: topical studies

  • Au croisement des archives numérisées et des archives du web. Le devenir du patrimoine numérisé de la Grande Guerre ( BDIC, BnF, Telecom Paris Tech)
  • Exploring French language song in the web archive (Univ. of Montreal)

Panel : Scholarly use and issues of web archives

  • L’historien de l’internet au risque des archives du Web (CNRS)
  • Vers un web temporel ? (Univ. Paris-Ouest)
  • De l'archive 1.0 à l'archive 2.0 : retour sur expériences (Univ. of Grenoble)
  • Web archive search as research (Univ. of Amsterdam)
  • Web archives of deleted youth (Pratt Institute)

Lunch

Keynote

Web Science, Web Analytics and Web Archives - Humans in the Loop (Univ. of Hannover)

Session: large scale solutions and initiatives

  • Enabling machine-scale analysis of web data (Common Crawl)
  • Mining a large web corpus (Univ. of Mannheim)
  • Web-based Ultra Large Scale Corpus (NINJAL)
  • From web archiving services to web scale data processing (Internet Memory Foundation)

Session: Building/integrating collections and tools

  • Building a national collection of the historical UK web (British Library)
  • Data Analysis and Resource Discovery (UK Government Web Archive)
  • HIBERLINK: quantifying and addressing link rot in scholarly communications (Los Alamos)
  • Proprioception : a tool kit for web archive datamining (INA)

Concluding remarks

Univ. of Aarhus

Lieux

  • Bibliothèque nationale de France, Grand Auditorium - Quai François Mauriac
    Paris, France (75013)

Dates

  • lundi 19 mai 2014

Fichiers attachés

Mots-clés

  • archivage de l'internet, analyse de corpus, humanités numériques, web studies, digital humanities, corpus analytics, archiving

Contacts

  • Peter Stirling
    courriel : peter [dot] stirling [at] bnf [dot] fr

Source de l'information

  • Clément Oury
    courriel : clement [dot] oury [at] bnf [dot] fr

Pour citer cette annonce

« Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse », Journée d'étude, Calenda, Publié le vendredi 16 mai 2014, http://calenda.org/285302