AccueilScience XXL

Science XXL

XXL science

Ce que l'abondance et la diversité des données numériques font aux pratiques de recherche en sciences sociales

What the abundance and diversity of digital data do to social sciences

*  *  *

Publié le mercredi 22 février 2017 par João Fernandes

Résumé

Données de l’internet, données administratives, données de capteurs, fichiers de gestion, etc., le volume d’informations numériques disponibles a fortement cru ces dernières années. Une fois passée la fascination pour ces gisements de données en apparence gratuites, abondantes et immédiatement disponibles, les questions soulevées par l’usage scientifique de ces masses numériques sont nombreuses. Les questions d’accès et de propriété des données compliquent le travail ou modifient la place des chercheur·e·s, qu’elles/ils soient demandeur·e·s ou, de manière croissante, sollicité·e·s par les producteurs pour les traiter. L’objectif de ces journées d’étude est de prolonger ces réflexions théoriques, méthodologiques, épistémologiques et éthiques pour savoir ce que l’abondance et la diversité des données numériques font aux pratiques de recherche en sciences sociales, en France comme à l’étranger.

Annonce

Présentation

Nous sommes heureux de vous communiquer le programme (pj) des journées d’étude « Science XXL. Ce que l’abondance et la diversité des données numériques font aux pratiques de recherche en science sociales ».

Les Journées  sont co-organisées par l’Ined et le SAGE, et se dérouleront à l’Ined (133 bd Davout 75020 Paris) les jeudi 16 et vendredi 17 mars. L’entrée est libre ; l’inscription est obligatoire  ici.

Plus d’informations sur Data.Hypotheses.org

Programme

Jeudi 16 mars

9h00-9h30 Accueil café

9h30 Introduction

Mot d’accueil : Magda Tomasini (Directrice de l’Ined)

Introduction générale : Anne LAMBERT (Ined/CMH) et Étienne OLLION (SAGE/Université de Strasbourg)

10h00-12h00 Session 1 « Sources et enquêtes »

Président : Étienne Ollion (SAGE)

Discutant : Baptiste Coulmont (CSU/Université Paris 8)

Présentations courtes

  • Antoine BEVORT (Lise/Cnam/CNRS), La Webanalytics des sites socio-politiques : méthodologie et études empiriques
  • Antoine COURMONT (CEE/Sciences Po), Ouvrir les données publiques : les données à l’épreuve de leur diffusibilité
  • Laurent BEAUGUITTE (IDEES/CNRS), Hughes PECOUT (CIST), Marta SEVERO (Dicen-IDF/ Université Paris Nanterre), Les flux RSS pour étudier l’actualité internationale
  • Andrey GRUNIN (CIHAM/Université d’Avignon), Pour des données historiques massives : ambitions, enjeux, questionnements
  • Léonard MOULIN (Ined), Étudier les trajectoires étudiantes à l’aide de données administratives
  • Muriel EPSTEIN et Nicolas BOURGEOIS (SAMM/Université Paris 1), Des blogs enseignants comme « meilleurs entretiens non directifs » ? L’apport d’une analyse textuelle quantitative
  • Alexandre HOBEIKA (CMH/SAGE), Nethnographie et jeux d’échelle : comment l’outillage méthodologique se modifie-t-il avec la taille du corpus ?

Déjeuner libre

14h00-16h00 Session 2 « Outils »

Présidente : Eva Lelièvre (Ined)

Discutant : Arthur Charpentier (CREM/Université Rennes 1)

Présentations longues

  • Étienne OLLION (SAGE/Université de Strasbourg) et Julien BOELAERT (SAGE/Université de Strasbourg), Ce que peut le machine learning
  • Églantine SCHMITT (Costech/Université technologique de Compiègne), Quelle ingénierie logicielle pour le traitement de données textuelles en sciences sociales ?

Présentations courtes

  • Nicolas ROBETTE (ENSAE), Audrey MARIETTE (CSU/Université Paris 8), Laure DE VERDALLE (Printemps//Université Versailles Saint Quentin), Karim HAMMOU (CSU/Universté Paris 8), Heaven’s gate? Construction d’une base de films par agrégation de diverses sources Internet
  • Paul GIRARD, Mathieu JACOMY, Christophe LECLERCQ (Sciences Po/médialab), Explorer association et transformation à travers des datascapes
  • Léo JOUBERT (LEST/Université d’Aix-Marseille), Global et local dans les communautés numériques. Le cas de Wikipedia
  • Valérie BEAUDOUIN, Florence d’ALCHE-BUC, Adrien NOUVELLET, Christophe PRIEUR, François ROUEFF (LTCI/Telecom ParisTech), Ce que le web fait à une bibliothèque : étudier les usages de Gallica par les traces
  • Pierre-Olivier CHASSET, Hadrien COMMENGES (Géographie-Cités/Université Paris 1), Clémentine COTTINEAU (CASA/University College of London), Christine KOSMOPOULOS (Géographie-Cités/Université Paris 1), Denise PUMAIN (Géographie-Cités/Université Paris 1), Juste RAIMBAULT (LVMT/Université Paris-Est), CybergeoNetworks : un outil interactif pour l’analyse de corpus bibliométriques massifs

16h00-16h30 Pause

16h30-18h00 Table ronde

Les sciences sociales et les données numériques : tour d’horizon disciplinaire

  • Claire LEMERCIER (CSO/CNRS)
  • Pauline GIVORD (Insee)
  • Dominique CARDON (médialab/Sciences Po)

18h00-19h30 Cocktail

Vendredi 17 mars

10h00-12h30 Session « Droit et éthique »

Président : Alain Trognon (Insee)

Discutantes : Florence WEBER (École Normale Supérieure/CMH) et Béatrice CHERRIER (Université de Caen/CREM)

Table ronde débat : Quels droits pour l’enquête en sciences sociales ?

Présentations courtes

  • Pierre-Antoine BILBAUT (Ined/CERLIS), Aspirer des données et après ? Questions d’éthique et de méthode
  • Jérémie GARRIGUES (STSLab/Université de Lausanne), Accès aux données numériques et formalisation algorithmique : le cas du crawl d’une plateforme de livewebcam
  • Bilel BENBOUZID (LISIS/Université Paris-Est), Nicolas BAYA-LAFFITE (STSLab/Université de Lausanne), Jean-Philippe COINTET (Inra/LISIS), Le sociologue et les dataproviders : quelles liaisons dangereuses ?

Déjeuner libre

14h00-16h00 Session : « Savoirs »

Présidente : Anne Lambert (Ined/CMH)

Discutant : Rémy Caveng (CURAPP/Université de Picardie)

Présentations courtes

  • Paul HOBEIKA (CSU/Université Paris 8), Quelles catégories statistiques pour étudier les inégalités entre retraités ? Apports et limites des bases de données administratives
  • Yoann DEMOLI (Printemps/Université Versailles Saint-Quentin), Enseigner les méthodes quantitatives grâce aux big data : retour d’expérience
  • Olivier CABRIGNAC (Global Life), Arthur CHARPENTIER (CREM/Université de Rennes 1), Ewen GALLIC (CREM/Université de Rennes 1), Les données collaboratives généalogiques au service de la démographie historique

Présentaions longues

  • Marie BERGSTRÖM (Ined), Sites de rencontre : un nouveau site d’observation de la formation des couples
  • Gilles BASTIN (Pacte/Sciences Po Grenoble), Le datascraper est-il un observateur participant comme un autre ? Un retour d’expérience sur le réseau LinkedIn

Argumentaire

Données de l’Internet, données administratives, données de capteurs, fichiers de gestion (du personnel, d’adhérents, d’anciens élèves), etc…. le volume d’informations numériques disponibles a fortement cru ces dernières années. Une fois passée la fascination pour ces gisements de données en apparence gratuites, abondantes et immédiatement disponibles, les questions soulevées par l’usage scientifique de ces masses numériques sont nombreuses.

Certaines sont classiques, d’autres moins, d’autres enfin se posent avec une acuité renouvelée.
Le plus souvent produites à des fins gestionnaires, administratives ou commerciales, les informations collectées ne sont pas toujours utiles pour les chercheur-e-s, en tous cas pas immédiatement ; quoique massives, elles ne sont pas toujours plus précises, ni plus fiables que des données d’enquête classique ; les questions d’accès et de propriété des données compliquent le travail ou modifient la place des chercheur-e-s, qu’elles-ils soient demandeur-e-s ou, de manière croissante, sollicité-e-s par les producteurs pour les traiter.

L’objectif de ces journées d’étude est de prolonger ces réflexions théoriques, méthodologiques, épistémologiques et éthiques pour savoir ce que l’abondance et la diversité des données numériques font aux pratiques de recherche en sciences sociales, en France comme à l’étranger.

Lieux

  • INED - 133 boulevard Davout
    Paris, France (75020)

Dates

  • jeudi 16 mars 2017
  • vendredi 17 mars 2017

Mots-clés

  • big data, enquête, sciences sociales, outil, savoirs

Contacts

  • Anne Lambert
    courriel : sciencexxl [at] gmx [dot] com

URLS de référence

Source de l'information

  • Anne Lambert
    courriel : sciencexxl [at] gmx [dot] com

Pour citer cette annonce

« Science XXL », Journée d'étude, Calenda, Publié le mercredi 22 février 2017, http://calenda.org/395544