Corpus, données, modèles : approches qualitatives et quantitatives

Envoyer Imprimer

Corpus, données, modèles : approches qualitatives et quantitatives

VIIe Colloque jeunes chercheurs / Praxiling UMR5267 (ITIC UM3-CNRS)

Appel à contributions
Date limite : 31 octobre 2010

 

9 et 10 Juin 2011
Salle des colloques, CNRS, Montpellier
http://praxiling.univ-montp3.fr/spip.php?article240

La notion de corpus est relativement consensuelle en sciences du langage. Il n'est pas rare de considérer que la constitution d'observables linguistiques à partir de données empiriques issues de l'usage est un préalable fondamental à toute théorisation sur la langue. L'ensemble des données recueillies par le chercheur est généralement défini comme « l'univers du discours ». Le corpus se définit quant à lui comme l'ensemble des données recueillies soumises à l'analyse.

Si la majorité des linguistes s'accorde sur le caractère nécessaire de la constitution d'un corpus comme base de toute théorisation, un certain nombre de problèmes se pose inévitablement.

C'est pourquoi la nouvelle édition 2011 du colloque Jeunes Chercheurs Praxiling souhaite appréhender les différentes approches du corpus, interroger les méthodes de constitution et de traitement de corpus ainsi que sa place et sa pertinence dans l'analyse.

Une grande attention sera accordée aux communications qui contribueront à développer des pistes de réflexion autour des thèmes suivants :

- Recueil des données
- Constitution du corpus
- Éthique et constitution de corpus
- Traitement du corpus
- Pertinence du corpus
- Corpus driven / corpus based
- Multimodalité et corpus vidéos
- Corpus oraux
- Analyse et traitement des corpus

Du point de vue méthodologique, en amont, on peut constater qu'il existe d'importantes différences dans les pratiques de constitution de corpus et dans leur traitement. Les diverses conceptions de la notion de corpus renvoient à des domaines hétérogènes en sciences du langage qui font appel à des méthodes de traitement variées.

On peut ainsi se demander dans quelle mesure un corpus peut être exhaustif, comment se sélectionne et se délimite un corpus, comment il se constitue et quelle est la nature des données (recueil des données audio, vidéo, numérique, notes, observations ethnographiques). Peut-on et doit-on fixer un seuil minimum du nombre d'occurrences permettant de considérer qu'un corpus est pertinent ? Quelles méthodes sont mises en œuvre pour recueillir ces données ? Comment motiver ses choix pour élaborer un corpus en vue d'une analyse multimodale (corpus vidéos et corpus d'interactions numériques) ? Comment prendre en compte les problèmes éthiques dans le recueil des données ?

Du point de vue scientifique, un corpus pourrait se définir comme une sélection aléatoire d'un ensemble d'énoncés ayant pour but d'être représentatif d'un état de langue à un moment donné. Or, la recherche scientifique s'inscrit dans une démarche se voulant objective et basée sur des données irréfutables. Par conséquent, il semble légitime de se demander en quoi un corpus est représentatif. Dans quelle mesure peut-il être considéré comme valide et pertinent dans le cadre d'une théorisation ? L'hétérogénéité de ses éléments tout comme la subjectivité inhérente aux choix opérés par le chercheur ne constituent-t-elles pas un obstacle à la démarche scientifique ? Le corpus a été présenté ici comme un composant essentiel de la recherche. On peut cependant s'interroger sur la place qui est accordée au corpus dans l'analyse des données : quelle différence peut-on établir entre les analyses fondées sur corpus (corpus-based) et les analyses guidées par corpus (corpus-driven) ?

Enfin, dans une perspective allant au-delà de la recherche particulière, on peut questionner le lien qui existe entre un corpus et l'objet de recherche : peut-on prétendre élaborer des corpus de référence permettant une pluralité de recherche ou bien n'est-il valide que pour une recherche précise à un moment donné ?

Conférenciers invités :
— Damon MAYAFFRE (UMR 6039 BCL – CNRS, Université de Nice Sophia-Antipolis)
— Lorenza MONDADA (ICAR UMR 5191, Université Lyon 2)
— Agnès WITKO (Université Claude Bernard Lyon1 Institut des Sciences et Techniques de Réadaptation- École d'Orthophonie de Lyon)

Public Concerné
Sont invités à proposer une communication les jeunes chercheurs issus de tout domaine scientifique dont l'objet d'étude est lié au corpus. Ce colloque devrait permettre de réunir et de confronter les travaux de jeunes chercheurs portant sur plusieurs domaines scientifiques : linguistique, sociologie, psychologie, information et communication.

Soumissions
Les propositions de communications orales ou affichées devront comporter 500 mots au maximum (références exclues). Les auteurs devront soumettre leur proposition par le formulaire sur le site avant le 31 octobre 2010.
Les propositions seront examinées anonymement par deux membres du comité scientifique.
Les propositions acceptées donneront lieu à une communication de 20 minutes + 5 minutes de questions.
Les posters scientifiques seront affichés durant la totalité du colloque et une séance sera consacrée à leur présentation.

Dates importantes
- Date limite de soumission des propositions : 31 octobre 2010
- Notification d'acceptation : 15 Décembre 2010
- Envoi des articles définitifs : 15 mars 2011
- Date du Colloque : 9-10 Juin 2011

Actes du colloque
Le colloque donnera lieu à la publication d'une sélection de communications. Il sera demandé aux auteurs d'envoyer leurs articles avant le 15 mars 2011.

Le colloque en baladodiffusion
Le colloque sera entièrement disponible en vidéo sur la plateforme de baladodifussion Parole de Chercheurs. Ce site promeut la diffusion du savoir scientifique par la mise en ligne de conférences.

Newsletter du colloque CJC Praxiling 2011
Si vous souhaitez être tenu informé de l'actualité du colloque (conférenciers invités, dates limites, inscription, publication...) ou ne pas rater la date limite de proposition des communications, alors inscrivez-vous à la newsletter du colloque CJC Praxiling 2011.

Comité scientifique :
Melissa Barkat-Defradas (Praxiling UMR 5267 Université Montpellier 3-CNRS)
Olivier Baude (Coral EA 3850, Université d'Orléans)
Roxanne Bertrand (Parole et Langage - UMR 6057 CNRS, Université de Provence)
Mireille Bilger (CILSH, Université de Perpignan)
Jacques Bres (Praxiling UMR 5267 Université Montpellier 3-CNRS)
Matthias Broth (Institutionen för kultur och kommunikation (IKK), Linköpings universitet, Suède)
Anne Dister (Centre de recherche VALIBEL / CENTAL, Université catholique de Louvain)
Sylvain Kahane (MoDyCo UMR 7114 CNRS, Université Paris X)
Sarah Leroy (MoDyCo UMR 7114 CNRS, Université Paris X)
Damon Mayaffre (UMR 6039 BCL – CNRS, Université de Nice Sophia-Antipolis)
Sylvie Mellet (UMR 6039 BCL – CNRS, Université de Nice Sophia-Antipolis)
Lorenza Mondada (ICAR UMR 5191, Université Lyon 2)
Chrysta Pellisier (Praxiling UMR 5267 Université Montpellier 3-CNRS)
François Rastier (Ertim-INALCO, Université Paris X)

En savoir plus
Site Internet: http://praxiling.univ-montp3.fr/spip.php?article240
Contact : Cette adresse email est protégée contre les robots des spammeurs, vous devez activer Javascript pour la voir.

Comité d'organisation :
Lucie Alidières
Sophie Azzopardi
Camille Capelle
Véronique Carrière
Hye Ran Lee
Clair-Antoine Veyrier

Laboratoire Praxiling UMR 5267 (Institut des Technosicences de l'Information et la Communication / Université Montpellier 3 –CNRS)
http://praxiling.univ-montp3.fr

 

Source : Fabula

 

Inscription à la lettre d'informations



Recevoir du HTML ?

Identification