HomeBuilding Modern Research Corpora: the Evolution of Web Archiving and Analytics

Building Modern Research Corpora: the Evolution of Web Archiving and Analytics

Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse

Opening conference of the General Assembly of the International Internet Preservation Consortium

Conférence d'ouverture de l'assemblée générale du consortium international pour la préservation de l'internet

*  *  *

Published on Friday, May 16, 2014 by Elsa Zotian

Summary

Pendant cinq jours, la BnF accueille les experts mondiaux de l’archivage du web, en collaboration avec l’Institut national de l’audiovisuel (INA) et l’Internet Memory Foundation (IMF). La semaine s’ouvre avec une conférence (lundi 19 mai) destinée aux chercheurs, archivistes et bibliothécaires spécialistes d’internet.

Announcement

Présentation

Pendant cinq jours, la BnF accueille les experts mondiaux de l’archivage du web, en collaboration avec l’Institut national de l’audiovisuel (INA) et l’Internet Memory Foundation (IMF). La semaine s’ouvre avec une conférence (lundi 19 mai) et se termine par des ateliers (jeudi 22 après-midi et vendredi 23 mai) destinés aux chercheurs, archivistes et bibliothécaires spécialistes d’internet. Les autres journées sont consacrées à l’assemblée générale du consortium international pour la préservation de l’internet et sont réservées à ses membres. L’IIPC regroupe 48 institutions patrimoniales et de recherche, dont l'INA et l'IMF, ainsi que de nombreuses bibliothèques nationales et Internet Archive.

Programme

Welcome

Keynote


The role of the web Observatory in web archiving and analytics (Univ. of Southampton)

Session: Web archives needs and projects across time and social sciences: topical studies

  • Au croisement des archives numérisées et des archives du web. Le devenir du patrimoine numérisé de la Grande Guerre ( BDIC, BnF, Telecom Paris Tech)
  • Exploring French language song in the web archive (Univ. of Montreal)

Panel : Scholarly use and issues of web archives

  • L’historien de l’internet au risque des archives du Web (CNRS)
  • Vers un web temporel ? (Univ. Paris-Ouest)
  • De l'archive 1.0 à l'archive 2.0 : retour sur expériences (Univ. of Grenoble)
  • Web archive search as research (Univ. of Amsterdam)
  • Web archives of deleted youth (Pratt Institute)

Lunch

Keynote

Web Science, Web Analytics and Web Archives - Humans in the Loop (Univ. of Hannover)

Session: large scale solutions and initiatives

  • Enabling machine-scale analysis of web data (Common Crawl)
  • Mining a large web corpus (Univ. of Mannheim)
  • Web-based Ultra Large Scale Corpus (NINJAL)
  • From web archiving services to web scale data processing (Internet Memory Foundation)

Session: Building/integrating collections and tools

  • Building a national collection of the historical UK web (British Library)
  • Data Analysis and Resource Discovery (UK Government Web Archive)
  • HIBERLINK: quantifying and addressing link rot in scholarly communications (Los Alamos)
  • Proprioception : a tool kit for web archive datamining (INA)

Concluding remarks

Univ. of Aarhus

Places

  • Bibliothèque nationale de France, Grand Auditorium - Quai François Mauriac
    Paris, France (75013)

Date(s)

  • Monday, May 19, 2014

Keywords

  • archivage de l'internet, analyse de corpus, humanités numériques, web studies, digital humanities, corpus analytics, archiving

Contact(s)

  • Peter Stirling
    courriel : peter [dot] stirling [at] bnf [dot] fr

Information source

  • Clément Oury
    courriel : clement [dot] oury [at] bnf [dot] fr

To cite this announcement

« Building Modern Research Corpora: the Evolution of Web Archiving and Analytics », Study days, Calenda, Published on Friday, May 16, 2014, https://calenda.org/285302

Archive this announcement

  • Google Agenda
  • iCal