AccueilConstituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse

Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse

Building Modern Research Corpora: the Evolution of Web Archiving and Analytics

Conférence annuelle du consortium international pour la préservation de l’internet (IIPC)

Annual conference of the International Internet Preservation Consortium (IIPC)

*  *  *

Publié le vendredi 15 novembre 2013 par Elsa Zotian

Résumé

Cette conférence vise à offrir un forum où les chercheurs, bibliothécaires, archivistes et autres « humanistes numériques » échangent des idées, des besoins, des méthodes et des outils qui pourront être utilisés pour la constitution et l’exploitation collaboratives de corpus d’archives du web, ou des jeux de données qui en sont tirés.

Annonce

Chaque année, le consortium international pour la préservation de l’internet (IIPC) organise une conférence d’une journée, ouverte au public, dans le cadre de son assemblée générale. Elle aura lieu le 19 mai 2014 à Paris, à la Bibliothèque nationale de France.

Le thème de cette année est : « Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse ».

Argumentaire

Depuis plus de 15 ans, bibliothèques, archives et autres institutions scientifiques ou patrimoniales se lancent dans des projets d’archivage du web. Les premiers projets s’intéressaient surtout à la collecte des contenus, en s’efforçant de capturer un ensemble de documents liés entre eux, et de reconstituer leurs différentes strates au fil du temps. Au même moment, les études sur le web se développaient, influençant les usages possibles des archives du web par les chercheurs et les universitaires. De nouveaux besoins ont émergé. Si l’objectif de constituer des collections d’intérêt général reste valide, les institutions et les chercheurs impliqués dans l’archivage du web doivent aussi collaborer pour constituer des corpus spécifiques.

En outre, « naviguer sur le web comme le faisait à l’époque » n’est plus le seul moyen d’accéder à des contenus web archivés. Les méthodes développées pour analyser de larges jeux de données – comme la fouille de données ou de liens – sont adaptables aux archives du web. Ces collections ont donc vocation à devenir les composantes de projets ou d’infrastructures majeures dans le domaine des humanités ou des sciences sociales. Analysées à l’aide de protocoles et d’outils performants, elles peuvent apporter une connaissance inestimable sur les sociétés contemporaines.

Cette conférence vise à offrir un forum où les chercheurs, bibliothécaires, archivistes et autres « humanistes numériques » échangent des idées, des besoins, des méthodes et des outils qui pourront être utilisés pour la constitution et l’exploitation collaboratives de corpus d’archives du web, ou des jeux de données qui en sont tirés. Les contributions peuvent porter sur :

  • des modèles de collaboration entre institutions d’archivage et chercheurs ;
  • des méthodes et des outils pour réaliser des analyses de données sur les archives du web ;
  • des exemples d’études réalisées sur des archives du web ;
  • des méthodes alternatives de collecte de contenus web.

La participation est libre mais une inscription préalable est obligatoire.

Conditions de soumission

Les résumés (une page maximum) doivent être envoyés à Peter Stirling (peter.stirling@bnf.fr)

le 1er décembre au plus tard.

Les résultats seront communiqués le 6 janvier 2014.

Les résumés doivent être soumis en anglais mais les conférenciers pourront intervenir entre anglais ou en français. Une traduction simultanée (français/anglais) sera disponible.

Les présentations seront publiées sur le site de l’IIPC, mais il n’y aura pas de publication d’actes. Les intervenants qui souhaitent une publication sont invités à envoyer en parallèle leur résumé à Alexandria, The Journal of National and International Library and Information Issues, pour son édition spéciale consacrée à l’archivage du web (en anglais uniquement : les résumés sont dus pour le 13 décembre. Plus d’informations sur www.manchesteruniversitypress.co.uk/journals/alx ou de la part du responsable de la publication, Monica Blake, à l’adresse info@blakeinformation.com).

Dans la même semaine, des espaces seront disponibles pour organiser des ateliers ou des formations sur des outils, des concepts ou des questions relatives à l’archivage du web. Les années précédentes, ces ateliers ont porté sur les questions juridiques, la formation à Hadoop, ou le « crowdsourcing » pour l’archivage du web. Les ateliers seront tenus les jeudi 22 et vendredi 23 mai 2014.

Les propositions d’ateliers (deux pages maximum) doivent être envoyées à Peter Stirling (peter.stirling@bnf.fr)

le 1er décembre au plus tard.

Les résultats seront communiqués le 6 janvier 2014.

Conditions d'évaluation

Les propositions seront évaluées par un comité composé de praticiens et de chercheurs dans le domaine de l’archivage du web.

Les membres du comité sont :

  • Abbie Grotke, Bibliothèque du Congrès (USA)
  • Gildas Illien, Bibliothèque nationale de France
  • Rosalie Lack, California Digital Library (USA)
  • Hansueli Locher, Bibliothèque nationale suisse
  • Leïla Medjkoune, Internet Memory Foundation (Pays-Bas / France)
  • Claude Mussou, Institut national de l’Audiovisuel
  • Clément Oury, Bibliothèque nationale de France
  • Mary Pitt, responsable des programmes et de la communication de l’IIPC

Le consortium international pour la préservation de l’internet est une organisation qui se consacre à l’amélioration des outils, des standards, et des bonnes pratiques dans le domaine de l’archivage du web. Il promeut la collaboration internationale ainsi que l’accès et l’utilisation les plus larges possible des archives du web pour la recherche et le patrimoine culturel. Pour plus d’information sur l’IIPC, voir http://netpreserve.org.

Lieux

  • Bibliothèque nationale de France - Quai François Mauriac
    Paris, France (75013)

Dates

  • dimanche 01 décembre 2013

Mots-clés

  • archivage de l'internet, analyse de corpus, humanités numériques, web studies, digital humanities, corpus analytics, archiving

Contacts

  • Peter Stirling
    courriel : peter [dot] stirling [at] bnf [dot] fr
  • Clément Oury
    courriel : clement [dot] oury [at] bnf [dot] fr

Source de l'information

  • Peter Stirling
    courriel : peter [dot] stirling [at] bnf [dot] fr

Pour citer cette annonce

« Constituer des corpus pour la recherche contemporaine : de l’archivage du web à son analyse », Appel à contribution, Calenda, Publié le vendredi 15 novembre 2013, http://calenda.org/263892