Building Modern Research Corpora: the Evolution of Web Archiving and Analytics
Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse
Opening conference of the General Assembly of the International Internet Preservation Consortium
Conférence d'ouverture de l'assemblée générale du consortium international pour la préservation de l'internet
Published on Friday, May 16, 2014
Abstract
Pendant cinq jours, la BnF accueille les experts mondiaux de l’archivage du web, en collaboration avec l’Institut national de l’audiovisuel (INA) et l’Internet Memory Foundation (IMF). La semaine s’ouvre avec une conférence (lundi 19 mai) destinée aux chercheurs, archivistes et bibliothécaires spécialistes d’internet.
Announcement
Présentation
Pendant cinq jours, la BnF accueille les experts mondiaux de l’archivage du web, en collaboration avec l’Institut national de l’audiovisuel (INA) et l’Internet Memory Foundation (IMF). La semaine s’ouvre avec une conférence (lundi 19 mai) et se termine par des ateliers (jeudi 22 après-midi et vendredi 23 mai) destinés aux chercheurs, archivistes et bibliothécaires spécialistes d’internet. Les autres journées sont consacrées à l’assemblée générale du consortium international pour la préservation de l’internet et sont réservées à ses membres. L’IIPC regroupe 48 institutions patrimoniales et de recherche, dont l'INA et l'IMF, ainsi que de nombreuses bibliothèques nationales et Internet Archive.
Programme
Welcome
Keynote
The role of the web Observatory in web archiving and analytics (Univ. of Southampton)
Session: Web archives needs and projects across time and social sciences: topical studies
- Au croisement des archives numérisées et des archives du web. Le devenir du patrimoine numérisé de la Grande Guerre ( BDIC, BnF, Telecom Paris Tech)
- Exploring French language song in the web archive (Univ. of Montreal)
Panel : Scholarly use and issues of web archives
- L’historien de l’internet au risque des archives du Web (CNRS)
- Vers un web temporel ? (Univ. Paris-Ouest)
- De l'archive 1.0 à l'archive 2.0 : retour sur expériences (Univ. of Grenoble)
- Web archive search as research (Univ. of Amsterdam)
- Web archives of deleted youth (Pratt Institute)
Lunch
Keynote
Web Science, Web Analytics and Web Archives - Humans in the Loop (Univ. of Hannover)
Session: large scale solutions and initiatives
- Enabling machine-scale analysis of web data (Common Crawl)
- Mining a large web corpus (Univ. of Mannheim)
- Web-based Ultra Large Scale Corpus (NINJAL)
- From web archiving services to web scale data processing (Internet Memory Foundation)
Session: Building/integrating collections and tools
- Building a national collection of the historical UK web (British Library)
- Data Analysis and Resource Discovery (UK Government Web Archive)
- HIBERLINK: quantifying and addressing link rot in scholarly communications (Los Alamos)
- Proprioception : a tool kit for web archive datamining (INA)
Concluding remarks
Univ. of Aarhus
Subjects
- Information (Main category)
- Mind and language > Information > Information sciences
- Mind and language > Information > Electronic publishing
- Mind and language > Information > History and sociology of the media
- Mind and language > Epistemology and methodology > Auxiliary sciences of history
- Mind and language > Epistemology and methodology > Methods of processing and representation
- Mind and language > Epistemology and methodology > Corpus approaches, surveys, archives
- Mind and language > Epistemology and methodology > Digital humanities
Places
- Bibliothèque nationale de France, Grand Auditorium - Quai François Mauriac
Paris, France (75013)
Date(s)
- Monday, May 19, 2014
Attached files
Keywords
- archivage de l'internet, analyse de corpus, humanités numériques, web studies, digital humanities, corpus analytics, archiving
Contact(s)
- Peter Stirling
courriel : peter [dot] stirling [at] bnf [dot] fr
Reference Urls
Information source
- Clément Oury
courriel : clement [dot] oury [at] bnf [dot] fr
License
This announcement is licensed under the terms of Creative Commons CC0 1.0 Universal.
To cite this announcement
« Building Modern Research Corpora: the Evolution of Web Archiving and Analytics », Study days, Calenda, Published on Friday, May 16, 2014, https://doi.org/10.58079/q1t