AccueilRecueil des données en Sciences du langage et constitution de corpus

Recueil des données en Sciences du langage et constitution de corpus

2ème Colloque des Jeunes Chercheurs du Laboratoire MoDyCo

*  *  *

Publié le jeudi 13 janvier 2005 par Natalie Petiteau

Résumé

Annonce

Les 16 et 17 juin 2005 se tiendra à l’Université Paris X

Il ne semble pas que la réflexion linguistique puisse faire l’économie d’énoncés sur lesquels s’appuyer ; désignés comme faits, données ou encore exemples, ces matériaux linguistiques peuvent constituer un corpus.

Parfois réservée aux seuls ensembles d’énoncés attestés (Arrivé et alii, 1986 1998, Riegel et alii, 1994 : 18), la dénomination corpus recouvre une réalité changeante (Mellet, 2002 : 6), la pression des approches quantitatives ayant joué un grand rôle dans la complexification de la notion (Habert, 1995 : 4).

Il s’agit donc de montrer à travers l’ensemble des communications que le recueil des données et la notion de corpus qui lui est associée, en apparence si simples à saisir et à décrire, sont problématiques. Selon les hypothèses de chaque chercheur, selon les savoirs, selon les disciplines (syntaxe, lexique, sémantique, analyse de discours…) le recueil des données ne sera ni de même envergure (Fillmore 1992), ni de même nature : on n’attribuera pas la même valeur à la notion de corpus.

Les communications pourront partir des interrogations suivantes :

- Qu’entend on par corpus ?

- Pourquoi constituer un corpus ?

- Sur quel type d’énoncés (attestés, forgés, oraux, écrits...) travailler ?

- De quelles sources extraire les données ? Est ce d’un certain type de source (la littérature, la presse…) ? Est ce à partir de supports existants (base de données informatisées, thèses soutenues, corpus répertoriés dans des ouvrages divers…) ?

- Comment et où collecter les données ? Est ce par le biais d’enquêtes ? A l’aide de requêtes sur Internet ou de logiciels disponibles ? Lesquels ?

- Quelle exploitation faire du corpus ? Approche quantitative, tris (sur quels critères ?) ? Quelle est la méthodologie adoptée ?

- On pourra également réfléchir aux problèmes soulevés par les notions représentativité, d’exhaustivité, de corpus clos, d’acceptabilité, de grammaticalité. Les problèmes terminologiques pourront également être discutés (« attesté » vs « forgé », « corpus » vs « base de données » par exemple).

Références citées

ARRIVE M., GADET F., GALMICHE M. (1986) La grammaire d’aujourd’hui. Paris, Flammarion.

CORBIN, P. (1980) « De la production de données en linguistique introspective », in A. M. Dessaux Berthonneau (ed.) Théorie linguistiques et traditions grammaticales, Villeneuve d’Asq, Presses Universitaires de Lille (pp. 121 179).

FILLMORE, C. J. (1992) « "Corpus linguistics" or "Computer aided armchair linguistics" », in J. Svartvik (ed.) Directions in Corpus Linguistics, Berlin/New York, Mouton de Gruyter (pp. 35 60).

HABERT, B. (1995) « Introduction », in T.A.L., 36, ATALA CNRS (3-5).

HABERT, B. (ed.) (2004) R.F.L.A. vol IX-1 : Linguistique et informatique :

nouveaux défis, Amsterdam, Edition "de Werelt".

MELLET, S. (2002) « Corpus et recherches linguistiques. Introduction », in S.

Mellet (ed.) Corpus, 1, Nice, Publications de la Faculté des lettres, arts et sciences humaines de Nice (pp. 5 12).

MILNER, J. C. (1989) Introduction à une science du langage, Paris, Le Seuil.

RIEGEL M., PELLAT J. C., RIOUL R. (1994) Grammaire méthodique du français, Paris, PUF.

Modalités de soumission

Les communications de 30 minutes seront suivies de 10 minutes de questions. Les propositions de communication seront évaluées anonymement par le comité scientifique.

Les auteurs feront parvenir leur proposition pour le 1er mars 2005 au plus tard par courrier électronique à coldoc_paris10@yahoo.fr, sous la forme suivante :

- dans le corps du message : nom, prénom, affiliation, niveau de la recherche

(DEA, Thèse 1, 2, 3, 4 ou plus), adresse de correspondance, titre de la communication ;

- dans un fichier joint au format .doc et dont le nom répondra au schéma suivant

<nomd’auteur.doc> : un résumé de 3 000 signes maximum reprenant le titre de l’exposé, une indication bibliographique (5 titres maximum)

Comité d’organisation

Anne Lablanche, Valelia Muni Toke, Céline Vaguer.

Calendrier :

- Mi janvier : Appel à communication.

- 1 mars 2005 : Limite des soumissions.

- 1er avril 2005 : Notification aux auteurs.

- 6 juin 2005 : Envoi de la première version de l’article.

- 16 17 juin 2005 : Colloque.

- 06/06 au 01/07 : Relecture des articles par le comité scientifique.

- 01/07 : Retour des articles accompagnés des remarques des relecteurs.

- 31/07 : Version définitive de l’article.

– Nanterre la seconde édition de Col’Doc, colloque organisé par les jeunes chercheurs du laboratoire Modèles, Dynamiques, Corpus (UMR 7114). L’objectif est de rassembler des étudiants de DEA, des doctorants et postdoctorants en Sciences du Langage, tous domaines confondus, autour d’un thème fédérateur : recueil des données et constitution de corpus.– mais en aucun cas le nom du/des auteurs, ni du laboratoire auquel il(s) est/sont rattaché(s).

Catégories

Lieux

  • Nanterre, France

Dates

  • mardi 01 mars 2005

Contacts

  • Anne Lablanche, Valelia Muni Toke, Céline Vaguer. ~
    courriel : coldoc_paris10 [at] yahoo [dot] fr

Source de l'information

  • Flore Chappaz
    courriel : flore [dot] chappaz [at] u-paris10 [dot] fr

Pour citer cette annonce

« Recueil des données en Sciences du langage et constitution de corpus », Appel à contribution, Calenda, Publié le jeudi 13 janvier 2005, http://calenda.org/189776