HomeBig Data et Machine Learning

Big Data et Machine Learning

Enjeux sociologiques, enjeux politiques

*  *  *

Published on Wednesday, May 15, 2019 by Anastasia Giardinelli

Summary

La journée d’étude s’organise autour du thème « Big data et apprentissage machine : enjeux sociologiques, enjeux politiques », et privilégie deux axes thématiques de réflexion au centre des questions que posent ces nouvelles méthodes. La matinée - consacrée à la mise au jour de "l'homme derrière la machine" - aura pour enjeu de mieux comprendre ce qui se joue dans les différents usages de ces techniques, sur un plan empirique, éthique et politique. L'après-midi - intitulé "la science derrière les machineries ?" - posera le débat sur un plan plus épistémologique, en interrogeant les conditions sous lesquelles la sociologie peut s'approprier ces techniques pour produire de la connaissance.

Announcement

ENS de Lyon, vendredi 24 mai, D4-117, 9h-17h30

Journée organisée par Antoine Larribeau et Corentin Roquebert

Présentation générale

La journée d’étude s’organise autour du thème « Big data et apprentissage machine : enjeux sociologiques, enjeux politiques », et privilégie deux axes thématiques de réflexion au centre des questions que posent ces nouvelles méthodes. La matinée - consacrée à la mise au jour de "l'homme derrière la machine" - aura pour enjeu de mieux comprendre ce qui se joue dans les différents usages de ces techniques, sur un plan empirique, éthique et politique. L'après-midi - intitulé "la science derrière les machineries ?" - posera le débat sur un plan plus épistémologique, en interrogeant les conditions sous lesquelles la sociologie peut s'approprier ces techniques pour produire de la connaissance.

Big data et machine learning sont en effet l'objet de discours nombreux qu'il s'agit de clarifier : entre paniques morales et annonces prophétiques sur la « fin de la théorie » ou avènement d’une nouvelle « rupture épistémologique », les chercheurs sont invités ici à prendre du recul pour prendre au sérieux les enjeux de pouvoir et de production du savoir qu'induisent ces nouvelles données et méthodes statistiques. De quoi parle-t-on lorsque l’on évoque le Big Data ? Quel peut être le rôle du sociologue à l’ère de ces nouvelles données ? Leur accès, récolte et traitement sont-ils le signe d'une plus grande « disparité de pouvoir entre entreprises privés et recherche publique » (Bastin & Tubaro, 2018) ?

Cette journée voudrait défendre une approche de l'étude des Big Data en train de se faire : tout autant que les données classiques en sociologie (par exemple, issus d'un questionnaire), elles sont loin d'être des données déjà données, c'est à dire produite en dehors de tout contexte social. Pour mieux saisir les transformations des manières de connaître et d'agir sur le monde social induites par ces techniques, il importe alors de s'interroger à la fois sur les modes de production de celles-ci, mais aussi sur leurs utilisations par des acteurs sociaux, que ce soit dans le champ scientifique ou dans d'autres sphères de la vie sociale (entreprise, institutions, etc.).

Format des présentations : 20 minutes de temps de parole + 10 minutes de question.

Programme

8h30-9h : accueil

Mots des organisateurs.

9h-12h30 : « L'humain derrière la machine : questionnements politiques et épistémologiques à l'ère de la "révolution" du Big Data »

Comment les Big data transforment-elles les sociétés ? Le Big Data se développe et s'étend dans de nombreux domaines de la vie économique et sociale, comme dans les entreprises ou dans les administrations publiques, mais également dans la sphère privée. Comment étudier et interpréter ce phénomène ? Faut-il insister sur les ruptures dans les manières de connaître ou de gérer des populations induites par ces techniques, ou n'y voir qu'une continuité par rapport aux modes traditionnels de gestion et de connaissance ?

En effet, les promesses et ambitions du Big Data, telles que les corrélations prédictives, sont souvent présentés comme des "révolutions". Entre-t-on dans un monde de "traces numériques", où tout serait plus facilement mesurable ? Que signifie cette multiplication des sources de mesure ('quantified self', objets connectés), rendant le "réel" plus quantifiable, ainsi que des possibilités de calcul et d'analyse ? Faut-il voir cette évolution comme une "chance" pour parvenir à une meilleure objectivation du monde ? Au contraire ne faut-il pas considérer ces nouvelles sources de données avec la même prudence que celle attribuer aux artefacts statistiques "traditionnels" ? Dès lors, il faut se méfier d'une vision discontinuiste, portée par les emphases d'une "révolution Big Data". Prendre du recul sur ces transformations et faire un objet d'étude des nouvelles techniques de calcul permet à la fois d'ouvrir la "boite noire" des algorithmes, en montrant les actes sociaux qui les produisent, mais aussi de questionner le "projet politique" (Cardon, 2015) que sous-tendent les discours de promotion de la prétendue "neutralité" axiologique de ces outils.

Par exemple, l'échec du projet d'algorithme de recrutement chez Amazon est éclairant. Entraîné sur des CV d'hommes, il reproduit les discriminations déjà existantes dans la société. Ainsi, initier un projet d'extension des opérations de dénaturalisation du monde social à la déconstruction du Big Data, n'est-ce pas l'occasion pour les sociologues de dévoiler l'existence et les ressorts d'une rationalité, voir d'un "sens pratique" algorithmique ? En effet, comme dans toute pratique de quantification (Desrosières, 1993), la technique est toujours produite par un entrelacement de croyances, de manière de penser et d'agir sur le monde social : il importe donc d'étudier les pratiques humaines derrière une apparente automatisation et d'interroger les schèmes de perception qui participe de la constitution d'une révolution quantitative comme représentation.

9h-9h30 : Emmanuel Didier, introduction à la journée.

9h30-10h : Cécile Favre, Machine learning et problématique de genre.

10h-10h30 : Jean-Sébastien Vayre, Big data, Machine learning et marché.

10h30-11h : Bilel Benbouzid, la police prédictive aux US. 10h30-11h.

11h-11h15 : Pause.

11h15-12h30 : Table ronde, animée par Antoine Larribeau.

12h30-14h : Déjeuner

14h-17h30 : La science derrière les machineries ? Quels défis théoriques et méthodologiques pour les sciences sociales ?

La profusion de données disponibles, associée à des nouvelles modélisations mathématiques et à des méthodes d’apprentissage algorithmique permet de renouveler les manières de faire de la statistique. Les possibilités offertes par les algorithmes (supervisés ou non) de machine learning posent donc un ensemble de « défis » pratiques et méthodologiques aux chercheurs. Les sociologues doivent-il amender leurs pratiques de recherche pour se convertir au machinisme ambiant ?

On se demandera donc la mesure dans laquelle les travaux actuels en sciences sociales s'approprient ces objets. Qu'apportent ces recherches et comment peut-on concrètement employer ces nouveaux outils ? En quoi permettent-ils d’améliorer, de compléter, voire de renouveler le regard des sciences sociales sur certains objets ?

Ces enjeux se retrouvent à un double niveau : celui de la construction des bases de données et celui de leurs traitements. Dans les deux cas, les procédures techniques s'éloignent des prérequis standards (quoique discutés) en sociologie quantitative (questionnaires posés à un échantillon représentatif d'une population, démarche hypothético-déductive plutôt qu'exploration à l'aveugle des corrélations, etc.), dont le fondement est une soumission des données à une question théorique, quand Big Data et machine learning semble plutôt imposer l'inverse. Pourtant, plutôt qu'un rapport de concurrence, on espère souligner ici qu'une complémentarité entre ces approches est possible, gouverné par une inventivité méthodologique qui est toujours le fait du chercheur.

Ainsi, en sociologie, il semble important de défendre un usage problématisé, raisonné et réflexif de ces méthodes, que ce soit une technique de collecte comme le webscraping, ou des techniques d'analyse modélisatrice comme les random forest ou le topic modeling : il s'agit alors de les utiliser sans se rendre aveugle aux effets de connaissance qu'elles produisent.

14h-14h30, Pablo Jensen, Modéliser des phénomènes physiques, modéliser des phénomènes sociaux.

14h30-15h, Gabriel Alcaras, Github et le « big code ».

15h-15h30, Marta Severo, Etudier des interactions politiques sur Twitter.

15h30-16h, Samuel Coavoux : Les recommandations algorithmiques dans un service de streaming de musique.

16h-16h15 : Pause.

16h15-17h30, Table ronde, animé par Corentin Roquebert.

Subjects

Date(s)

  • Friday, May 24, 2019

Keywords

  • big data, machine learning, quantification, sociologie

Contact(s)

  • Corentin Roquebert
    courriel : corentin [dot] roquebert [at] gmail [dot] com
  • Antoine Larribeau
    courriel : antoine [dot] larribeau [at] ens-lyon [dot] fr

Information source

  • Corentin Roquebert
    courriel : corentin [dot] roquebert [at] gmail [dot] com

To cite this announcement

« Big Data et Machine Learning », Study days, Calenda, Published on Wednesday, May 15, 2019, https://calenda.org/625973

Archive this announcement

  • Google Agenda
  • iCal