AccueilCorpus, données, modèles : approches qualitatives et quantitatives

Corpus, données, modèles : approches qualitatives et quantitatives

Septième colloque jeunes chercheurs praxiling UMR 5267 (ITIC UM3-CNRS)

*  *  *

Publié le lundi 10 mai 2010 par Marie Pellen

Résumé

En rassemblant des réflexions sur différents positionnements conceptuels de l’analyse de corpus, qu’ils soient qualitatifs ou quantitatifs, nous souhaitons proposer une vision d’ensemble, mais surtout une vision contrastée et pluridisciplinaire de la réflexion menée sur les pratiques actuelles de constitution et d'utilisation du corpus. Notre démarche ne se limite pas aux corpus textuels, mais souhaite entre autres problématiser aussi la constitution et l’analyse de corpus multimodaux qu’ils soient vidéos ou de nature hétérogène (textuel, vocal, visuel...).

Annonce

La notion de corpus est relativement consensuelle en sciences du langage. Il n'est pas rare de considérer que la constitution d'observables linguistiques à partir de données empiriques issues de l'usage est un préalable fondamental à toute théorisation sur la langue. L’ensemble des données recueillies par le chercheur est généralement défini comme «l’univers du discours». Le corpus se définit quant à lui comme l’ensemble des données recueillies soumises à l’analyse.

Si la majorité des linguistes s’accorde sur le caractère nécessaire de la constitution d’un corpus comme base de toute théorisation, un certain nombre de problèmes se pose inévitablement. C’est pourquoi la nouvelle édition 2011 du colloque Jeunes Chercheurs Praxiling souhaite appréhender les différentes approches du corpus, interroger les méthodes de constitution et de traitement de corpus ainsi que sa place et sa pertinence dans l'analyse.

Une grande attention sera accordée aux communications qui contribueront à développer des pistes de réflexion autour des thèmes suivants :

  • Recueil des données
  • Constitution du corpus
  • Éthique et constitution de corpus
  • Traitement du corpus
  • Pertinence du corpus
  • Corpus driven / corpus based
  • Multimodalité et corpus vidéos
  • Corpus oraux
  • Analyse et traitement des corpus textuels, oraux/vidéos
Du point de vue méthodologique, en amont, on peut constater qu’il existe d'importantes différences dans les pratiques de constitution de corpus et dans leur traitement. Les diverses conceptions de la notion de corpus renvoient à des domaines hétérogènes en sciences du langage qui font appel à des méthodes de traitement variées.
On peut ainsi se demander dans quelle mesure un corpus peut être exhaustif, comment se sélectionne et se délimite un corpus, comment il se constitue et quelle est la nature des données (recueil des données audio, vidéo, numérique, notes, observations ethnographiques). Peut-on et doit-on fixer un seuil minimum du nombre d'occurrences permettant de considérer qu'un corpus est pertinent ? Quelles méthodes sont mises en œuvre pour recueillir ces données? Comment motiver ses choix pour élaborer un corpus en vue d’une analyse multimodale (corpus vidéos et corpus d’interactions numériques) ? Comment prendre en compte les problèmes éthiques dans le recueil des données ?

Du point de vue scientifique, un corpus pourrait se définir comme une sélection aléatoire d’un ensemble d’énoncés ayant pour but d’être représentatif d’un état de langue à un moment donné. Or, la recherche scientifique s’inscrit dans une démarche se voulant objective et basée sur des données irréfutables. Par conséquent, il semble légitime de se demander en quoi un corpus est représentatif. Dans quelle mesure peut-il être considéré comme valide et pertinent dans le cadre d’une théorisation ? L’hétérogénéité de ses éléments tout comme la subjectivité inhérente aux choix opérés par le chercheur ne constituent-elles pas un obstacle à la démarche scientifique ? Le corpus a été présenté ici comme un composant essentiel de la recherche. On peut cependant s’interroger sur la place qui est accordée au corpus dans l’analyse des données : quelle différence peut-on établir entre les analyses fondées sur corpus (corpus-based) et les analyses guidées par corpus (corpus-driven) ?

Enfin, dans une perspective allant au-delà de la recherche particulière, on peut questionner le lien qui existe entre un corpus et l'objet de recherche : peut-on prétendre élaborer des corpus de référence permettant une pluralité de recherche ou bien n’est-il valide que pour une recherche précise à un moment donné ?

Public concerné

Sont invités à proposer une communication les jeunes chercheurs issus de tout domaine scientifique dont l'objet d'étude est lié au corpus. Ce colloque devrait permettre de réunir et de confronter les travaux de jeunes chercheurs portant sur plusieurs domaines scientifiques : linguistique, sociologie, psychologie, information et communication.

Soumissions

Les propositions de communication orales ou affichées devront comporter 500 mots au maximum (références exclues). Les auteurs devront soumettre leur communication par un formulaire sur le site de Praxiling avant le 31 octobre 2010. Les propositions seront examinées anonymement par deux membres du comité scientifique. Les propositions acceptées donneront lieu à une communication de 20 minutes + 5 minutes de questions. Les posters scientifiques seront affichés durant la totalité du colloque et une séance sera consacrée à leur présentation.

Actes du colloque

Le colloque donnera lieu à la publication d'une sélection de communications dans un ouvrage. Il sera demandé aux auteurs d'envoyer leurs articles avant le 15 mars 2011.

Le colloque en baladodiffusion

Le colloque sera entièrement disponible en vidéo sur la plateforme de baladodiffusion Parole de Chercheurs. Ce site promeut la diffusion du savoir scientifique par la mise en ligne de conférences.

Dates importantes

Date limite de soumission des propositions : 31 octobre 2010
Notification d'acceptation : 15 Décembre 2010
Envoi des articles définitifs : 15 mars 2011
Date du Colloque : 9-10 Juin 2011

Catégories

Lieux

  • Salle des colloques, CNRS
    Montpellier, France

Dates

  • dimanche 31 octobre 2010

Mots-clés

  • corpus, sciences du langage, sciences humaines

Contacts

  • Comité d'organisation du Colloque Jeunes Cherceurs Praxiling ~
    courriel : cjc2011 [dot] praxiling [at] gmail [dot] com

URLS de référence

Source de l'information

  • Colloque Jeunes Chercheurs Praxiling ~
    courriel : cjc2011 [dot] praxiling [at] gmail [dot] com

Pour citer cette annonce

« Corpus, données, modèles : approches qualitatives et quantitatives », Appel à contribution, Calenda, Publié le lundi 10 mai 2010, http://calenda.org/201120