AccueilL’analyse de corpus face à l’hétérogénéité des données

L’analyse de corpus face à l’hétérogénéité des données

D’une difficulté méthodologique à une nécessité épistémologique

*  *  *

Publié le vendredi 26 novembre 2010 par Marie Pellen

Résumé

L’objectif de cette journée est de parvenir à mesurer si l’hétérogénéité est un obstacle à la constitution des corpus – doit-on nécessairement postuler qu’un corpus est homogène et quelles sont les limites de cette homogénéité ? - et à son analyse – les résultats sont-ils recevables et aussi pertinents lorsque le corpus est hétérogène ? On défendra l’idée que l’hétérogénéité est une nécessité épistémologique et méthodologique.

Annonce

 

Université de Cergy-Pontoise - Maison des Sciences de l’Homme de Paris-Nord

Centre de Recherche Textes et Francophonies, pôle LaSCoD, pôle interdisciplinaire de recherche en Sciences du Langage et Sciences de l’Information et de la Communication

Université de Cergy-Pontoise, 11 février 2011, Salle Ananzie, Chênes 2

Journée coordonnée par Julien Longhi, Université de Cergy-Pontoise

Contact : julien.longhi@u-cergy.fr

Au cours de cette journée, les différents contributeurs essaieront de montrer comment l’intégration de données hétérogènes, à condition qu’elle dépasse le « bricolage » ou le comparatisme, peut ouvrir la voie à une linguistique de corpus fondée sur un matériau hétérogène. Ils s’attacheront à mettre en évidence les modalités de traitement de l’hétérogénéité, comprise comme variation des genres discursifs, des contextes et pratiques langagières, ou des situations d’énonciation, les types de codage qu’elle suppose, et ses retentissements sur les résultats. L’objectif est de parvenir à mesurer si l’hétérogénéité est un obstacle à la constitution des corpus – doit-on nécessairement postuler qu’un corpus est homogène et quelles sont les limites de cette homogénéité ?- et à son analyse – les résultats sont-ils recevables et aussi pertinents lorsque le corpus est hétérogène ? On défendra l’idée que l’hétérogénéité est une nécessité épistémologique et méthodologique.

11 février 2011

9h15-9h30 : Accueil

9h30-10h15 :

Julien Longhi – Maître de Conférences à l’Université de Cergy-Pontoise – CRTF-LaSCoD

« Présentation : Les formes du discours selon le genre et la circulation des discours : analyse sémantico-discursive et contrastive de deux corpus »

10h15-11h15 :

Mylène Blasco-Dulbecco – Maître de Conférences à l’Université Blaise Pascal de Clermont-Ferrand – LRL

« Étude comparative de corpus d’interview politiques pour cerner un genre de discours »

11h15-11h30 : Pause

11h30-12h30 :

Georgeta Cislaru & Frédérique Sitri – Maîtres de Conférences à Paris 3 et Paris 10 – SYLED

« De l'émergence à l'impact social des discours: hétérogénéités d'un corpus »

12h30-14h : Déjeuner 

14h-15h :

Bénédicte Pincemin, Chargée de Recherche au CNRS, UMR 5191 ICAR

« Hétérogénéité des corpus et textométrie »

15h-16h :

Jean-Yves Antoine – Professeur à l’Université de Tours – LI

« Influence du genre applicatif sur la réalisation des extractions en dialogue oral finalisé : constantes et variations »

16h-16h15 : Pause

16h15-17h15 :

Anaïs Lefeuvre & Natalia Vinogradova – Doctorantes à l’Université de Bordeaux 1 – projet ITIPY Équipe Signes

« Extraction d’information factuelle sur les déplacements dans un corpus hétérogène de récits de voyage »

17h15-18h : Discussion générale

Catégories

Lieux

  • Cergy-Pontoise (95000)
    Cergy, France

Dates

  • vendredi 11 février 2011

Contacts

  • Julien Longhi
    courriel : julien [dot] longhi [at] u-cergy [dot] fr

Source de l'information

  • Julien Longhi
    courriel : julien [dot] longhi [at] u-cergy [dot] fr

Pour citer cette annonce

« L’analyse de corpus face à l’hétérogénéité des données », Journée d'étude, Calenda, Publié le vendredi 26 novembre 2010, http://calenda.org/202701