Sciences et Technologies de l´Information et de la Communication pour l´Éducation et la Formation |
Volume 15, 2008 |
||||||||||||||||||||||||||||||||||||||||||||||||
Contribution à la structuration de
|
|
Simuligne |
Copéas |
Tridem 2005 |
Objectif Pédagogiques |
FLE en formation continue pour anglais |
Anglais pour Master2 FOAD |
Anglais/Français et interculture |
Institutions |
UFC, OU |
OU, UFC |
CMU, UFC, OU |
Participants |
- 1 coordinateur - 10 natifs (UFC), - 40 apprenants (OU)- 4 tuteurs (OU).- 4 groupes de 12- 1 groupe global (60) |
- 14 apprenants (UFC)- 2 tuteurs (OU)
|
- 28 apprenants : 13 USA, 10 FR, 5 GB - 5 tuteurs- 10 tridems |
Environnements technologiques |
Asynchrone (WebCT) |
Synchrone(Lyceum) Asynchrone(WebCT) |
Blogue
|
Interactions
|
- 2686 mess. forum, - 4062 courriels- 5680 tours de clavardage
|
- 5506 tours de parole audio (8h29 en temps cumulé)- 1529 tours de clavardage- 16 séances Lyceum |
-11 blogues archivés (avec 610 messages et 127 photos),- 1030 tours de clavardage- 19 séances Lyceum - 8 éval. indiv. |
Productions affichées |
342 pages web incluant 115 images et 44 fichiers audio |
Documents, cartes conceptuelles et tableaux blancs s |
10 documents, 4 cartes concept. 51 tableaux blancs |
Ressources pédagogiques |
guide apprenantguide tuteurguide natifs |
guide apprenantguide tuteur |
guide apprenant |
Scénario |
28 activités réparties en 7 étapes / 12 semaines, |
8 activités sur 10 semaines |
4 activités sur 10 semaines |
Questionnaires Entretiens |
12 questionn. apprenants, |
- 14 quest. apprenants, - 7 entretiens,- 9 Critical Event Recall (8 app., 1 tuteur) |
26 pré-questionn., 13 post-questionn., 13 post-entretiens (12 app., 1 tuteur) |
Taille |
Total : 650 Mo :- 30 000 fichiers répartis dans 2708 dossiers |
Total : 35,3 Go :- 37 vidéos (27h)- 512 autres fichiers dans 117 dossiers |
Total : 7,37 Go :- 16 vidéos (20h)- 939 fichiers |
Cession droits |
Oui |
Oui |
Oui |
Tableau 1 • Description synthétique des 3 ensembles de données : UFC (Univ. de Franche-Comté), OU (Open Univ.), CMU (Canergie Mellon Univ.)
Nous donnons ici des informations synthétiques sur les trois ensembles de données déjà en notre possession et qui seront transformés en corpus d'apprentissage, au sens défini en section 2. Le tableau 1 met en valeur la diversité des contextes pédagogiques (institutions, formations, objectifs pédagogiques, apprenants, domaines d’apprentissage), des environnements technologiques utilisés (synchrones / asynchrones) seuls ou combinés, le volume, la dispersion et l’hétérogénéité des données recueillies. Ces données permettent de décrire le scénario pédagogique, les interactions et productions et les données de recherche. La dernière ligne du tableau indique que nous possédons, pour chacun de ces ensembles de données, les contrats de cession des droits de la part des acteurs.
Nous nous appuierons ensuite sur des extraits de Simuligne, tant pour le scénario pédagogique, que pour l’instanciation, pour illustrer les différentes parties structurant un corpus d’apprentissage. Nous soulignons la souplesse du modèle en espaces de travail qui permet d’épouser par exemple la structuration du scénario pédagogique.
Le scénario pédagogique est la partie du corpus d’apprentissage qui décrit la formation prescrite : l’organisation en étapes et sous-étapes de l’activité, leurs dépendances, les rôles associés (ex : apprenant, natif, tuteur, etc.), ainsi que les environnements (ressources, espaces et outils) nécessaires à leur déroulement.
Nous préconisons l’utilisation de la spécification IMS-LD (IMS-LD, 2003) comme format de description du scénario. D’une part parce que ce formalisme est utilisé et répandu dans la communauté, d’autre part parce que la structuration des activités du scénario pédagogique (prescrit) peut être reprise dans la partie instanciation pour systématiser la structuration des données recueillies à l’issue du déroulement de la formation (cf section 3.3). Nous avons également choisi IMS-LD parce qu’il est basé sur une spécification XML indépendante des plateformes de téléformation.
La description du scénario inclut la description des environnements dans lesquels les activités ont lieu ; les rôles (qui seront incarnés par les différents acteurs) ; la méthode (IMS-LD, 2003) permet de décrire l’ordonnancement de l’ensemble des activités et tâches à réaliser au cours de la formation.
La figure 4 illustre un extrait de la formation Simuligne décrite en IMS-LD à4 (MOTPlus, 2005) MOTPlus4 (MOTPlus, 2005). Elle met en évidence les rôles (Apprenant et Tuteur) et la décomposition de la structure d’activité " E0 étape 0 et Interculture Prep " constituée d’une part de la séquence de deux structures d’activité (" Début E0 " et " Suite E0 ") et d’autre part " Interculture Prep " (Préparation).
Figure 4 • Niveau étape : Structure de l’activité Schéma MOTPlus (MOTPlus, 2005) de la formation Simuligne
La figure 5 offre une vue plus complète de la structure d’activité " Début E0 ". Elle montre en particulier des activités d’apprentissage (E0A1 et E0A2), de support (Correction biographie), les environnements (Forum " Principal " et " E0A3_RDV_bavardage ", " À rendre " et " Courriel ") inclus dans " l’environnement groupe " et dans lesquels auront lieu ces activités, les intrants et produits de ces activités (ex : Biographie) et les rôles des acteurs (ex : Apprenant, Natif).
Figure 5 • Niveau structure d’activité : activité, environnements, rôlesSchéma MOTPlus d’une structure d’activité de la formation Simuligne
Nous reprendrons sur la figure 9 de la section 3.3.2 l’exemple du forum " E0A3_RDV_bavardage " du groupe Gallia pour illustrer la manière dont un message est structuré dans la partie instanciation d’un corpus d’apprentissage.
Le terme " Instanciation " fait référence à la modélisation orientée objet. Par analogie, nous pouvons considérer que le scénario pédagogique est une classe tandis que le résultat du déroulement de la formation par un groupe donné d’acteurs, dans une plateforme technologique donnée, à une période donnée, constitue une instance de cette classe. Un même scénario peut être joué par différentes cohortes d’acteurs (formateurs, tuteurs, apprenants, natifs, etc.) au cours d’une même période (en parallèle) ou sur des périodes successives (typiquement des semestres universitaires).
Le cas de Simuligne apporte un nouveau degré de complexité : le scénario comportait 2 niveaux : un niveau global dans le groupe " Monde " dans lequel se déroulait l’activité Interculture mettant en relation tous les acteurs des différents " groupes de base " ayant joué à un niveau local en parallèle une Simulation Globale. Le résultat du déroulement de Simuligne donne donc lieu à une instance du " Monde " et quatre instances du groupe de base nommées respectivement : " Aquitania ", " Gallia ", " Lugdunensis " et " Narbonensis ", chacune peuplée par ses acteurs et recueillant leurs traces, interactions et productions.
Actuellement, notre communauté ne partage pas de norme définissant la structure des interactions issues de formations en ligne (cet aspect est détaillé dans la section 4.2). Pour notre projet, l’instanciation constitue le cœur du corpus : pour pouvoir analyser un corpus, il faut pouvoir disposer à la fois d’éléments sur les acteurs et groupes mais également disposer des interactions. Celles-ci doivent pouvoir être liées au contexte pédagogique défini précédemment. Nous proposons donc une structure générique pouvant contenir les informations sur les groupes et acteurs ainsi que les traces, interactions et productions qui résultent du déroulement du scénario.
Le caractère générique de cette structure doit assurer son indépendance vis-à-vis de la plateforme de téléformation utilisée. En effet, chaque plateforme connait une durée de vie limitée dans le temps, évolue d’une version à l’autre, empêchant parfois l’accès à des données anciennes, enregistrées dans un format obsolète. La constitution d’un corpus d’apprentissage ayant des visées à plus long terme, il est essentiel que son accès ne soit pas mis en péril par l’évolution des plateformes.
Cette nécessaire généricité induit un besoin d’expressivité capable de décrire aussi bien des activités (et donc des interactions, traces et productions) issues de scénarios pédagogiques variés impliquant des environnements tant synchrones qu’asynchrones.
Alors que le scénario pédagogique d’une formation décrit de façon abstraite, avant le déroulement de la formation, l’activité type d’un groupe en définissant les rôles sans les attribuer nominativement et en citant uniquement le type des outils utilisés (ex : forum, clavardage), lors de l’instanciation, il s’agit de préciser les différents acteurs (personnes physiques), leur organisation dans les différents groupes et les outils concrets (ex : forum et clavardage de WebCT). Les interactions et productions peuvent alors être décrites et faire référence aux acteurs.
Pour la définition des acteurs, nous avons choisi d’utiliser la spécification IMS Enterprise (IMS-Enterprise, 2002). Cette spécification est initialement prévue pour gérer les inscriptions des acteurs dans les cours au sein d’une plateforme, ainsi que les informations sur les cours et sur les utilisateurs. Nous restreignons ici son utilisation à la définition des acteurs (tuteurs, natifs, apprenants) et celle des groupes et à l’affectation des acteurs à un ou plusieurs groupes. Les informations nécessaires à la compréhension des interactions (en excluant les données personnelles non diffusables) sont décrites de même que les différents surnoms ou login sous lesquels on peut retrouver l’acteur dans les interactions/traces. Le produit final est donc un document XML respectant le schéma IMS Enterprise.
Pour la définition de l’environnement de travail, nous proposons une spécification sous forme de schéma XML (cf. figure 6) décrite dans la partie suivante. Ce schéma donne la structure du document XML associé dans lequel seront stockées les interactions.
Nous avons choisi de décrire un environnement technique (dispositif utilisé pour la formation) comme un espace de travail correspondant à un lieu dans lequel des acteurs disposent d’outils (dotés de certaines fonctionnalités explicitées) et interagissent dans une période donnée. Cet espace de travail peut inclure des sous-espaces de travail.
La spécification que nous proposons se veut la plus exhaustive possible quant aux outils de communication utilisables et quant à leurs fonctionnalités. Dans le cas où des outils ou fonctionnalités n’auraient pas été pris en compte par notre spécification, le descripteur peut enrichir ce schéma (par l’insertion de nouveaux outils ou fonctionnalités) pour lui permettre de décrire une variété croissante de corpus.
Figure 6. Extrait du schéma XSD de la partie instanciation
De plus, la définition récursive de la notion d’espace de travail (Workspace) permet au descripteur de corpus de choisir le niveau de granularité qu’il souhaite. Ainsi (cf. figure 6), l’espace de travail peut donc aussi bien correspondre à la formation, à une étape, à une activité qu’à une session de travail (notion correspondant plus à des formations synchrones). Elle permet d’organiser les interactions recueillies au cours des différentes activités et à travers les out(Noras et al., 2007)tion (Noras et al., 2007). La notion de Workspace laisse aux concepteurs de corpus la liberté d’organiser les interactions selon leur point de vue : par activité, par tranche temporelle, ou encore par type ou espace d’interaction : forum, chat, ...
Chaque espace de travail (Workspace) peut être lié par des références à des objets identifiés tels que des structures d’activité du scénario pédagogique qui définissent le contexte des traces recueillies dans cet espace de travail. Bien sûr, ces liens seront plus faciles à définir si les espaces de travail correspondent précisément aux structures d’activités définies dans le scénario pédagogique. Outre les membres (référence aux acteurs inscrits dans la formation, définis dans la partie précédente) et les dates de début et de fin, un espace de travail contient une liste déclarative des espaces/outils (tools) d’interaction disponibles et la liste des actes (acts), chacun d’entre eux faisant référence à l’un des espaces/outils déclarés. Ces espaces/outils sont typés (Forum, Clavardage, Audio, Vote, etc.) et possèdent un nom permettant de différencier deux outils de même type, tel que dans Simuligne par exemple, deux forums " Principal " et " E0A3_RDV_Bavardage " utilisés à l’intérieur d’une même activité " E0A1 " (figure 5). À chacun de ces espaces/outils, correspondront ensuite des actes stockés dans l’élément acts illustré sur la figure 9 (droite).
Figure 7. Extrait du schéma XSD – notion d’acte
Pour permettre une analyse globale des différents actes, il est indispensable de définir une partie générique à tout acte. C’est précisément l’objet de la figure 7 présentant notre définition d’un acte. Tout acte possède donc un identifiant (attribut id), une référence à l’espace/outil dans ou par lequel il a été déposé (ref_tool), une référence à l’auteur (author), une date de début (beginning_date) et un sélecteur de type d’acte.
Ce sélecteur (act_type), précisant le type d’acte (clavardage, forum, courriel, etc.), permet d’ajouter à la partie générique d’un acte une partie propre à ce type d’acte.
Figure 8. Extrait du schéma XSD – notion d’acte de forum
Le schéma d’un acte de type forum est donné à la figure 8. Celui-ci correspond au dépôt d’un message dans un fil de discussion. Ce message a un sujet, par exemple le titre du fil de discussion, et peut contenir la référence au message père, message auquel il répond. Chaque lecture (ouverture) de ce message peut être décrite par une date ainsi qu’une référence au membre lecteur. Le contenu du message est une liste d’éléments de trois types : un contenu original du message, une citation et une signature. Il peut également faire référence à un ensemble de fichiers attachés (nom, type, description, date du fichier).
La figure 9 (droite) correspond à la structuration XML de deux actes de forum déposés dans la plateforme WebCT au cours de la formation Simuligne (figure 9 gauche). La mise en évidence des champs " numéro de message ", " sujet " et " date " sur chacune de ces figures montre comment les informations recueillies sont structurées.
Figure 9 Gauche. Exemple de forum à décrire Droite Exemple de description d’actes de forum
Dans cette partie, nous abordons les conditions nécessaires pour réaliser l'échange et l'accès libre. Nous retenons trois sujets (droits et éthique, standard et normes, analyse de traces) qui méritent l'attention des chercheurs de notre domaine, même s'ils sont aujourd'hui peu explorés ou bien l'ont été seulement très récemment. Pour chacun, nous indiquons l'approche des membres du projet Mulce en la positionnant par rapport à ceux de la communauté et à d'autres communautés connexes. L'obtention de réponses cohérentes, simples, applicables, même si elles sont limitées, est indispensable au partage de corpus d'apprentissage et des recherches sur ces objets.
Nous avons mentionné en section 1, l'intérêt de premier plan que certains milieux concernés par l'apprentissage humain et les technologies expriment aujourd'hui sur les questions des droits et de l'éthique. Ces discussions ont pu être éludées jusqu'à récemment pour diverses raisons, la première tenant au fait que la mise sous clef des données produites dans les laboratoires de recherche évitait d'avoir à se poser la question. À un tout autre niveau, dans notre domaine, le fait d'utiliser des systèmes spécifiques plutôt que des systèmes généralistes (voir section 4.3) permettait de travailler sur des traces générées automatiquement, ce qui réduit d'emblée l'éventualité de l'identification des individus et donc de l'atteinte à leurs droits.
Le passage à l'accès libre et à l'échange de données (incluant les interactions, en particulier verbales, des acteurs de situation d'apprentissage) change radicalement les choses, en plaçant les sujets sur l'éthique et les droits avec une priorité élevée dans l'agenda de la recherche. Sous quelle perspective faut-il envisager d'aborder cela ? L'exemple actuel des débats sur les droits dans le milieu de l'édition scientifique et des archives ouvertes (Chanier, 2004) montre l'équilibre qu'il faut préserver, en examinant, d'une part, avec intérêt mais circonspection le point de vue de certains juristes, appuyés par les médias, qui essayent de faire jouer des règlements anciens, non appropriés aux nouveaux contextes pour la défense d'intérêts corporatistes et, d'autre part, la nécessité d'intégrer le nouveau contexte apporté par la société en réseaux en accordant la priorité aux règles que les communautés de savoirs ont élaborées (règles qui font évoluer la question du droit (Lessig, 2001)).
Alors que le positionnement des communautés scientifiques responsables du développement des archives ouvertes est le résultat de plus de 30 ans de réflexion et développement, notre communauté débute seulement ses réflexions. Les avancées s'accompliront tout à la fois en inscrivant ce thème dans notre recherche, en restant cohérent avec celles que d'autres communautés ont élaborées sur des thématiques plus large que les nôtres, et en restant pragmatique, au sens où la recherche de solutions simples et immédiatement applicables doit s'imposer afin de ne pas ralentir le travail des chercheurs. Pour ne prendre qu'un exemple, nombres d'universités étrangères ont depuis longtemps adopté des positions sur l'éthique propres à leurs institutions, qui contraignent fortement le montage des expérimentations et plus encore la diffusion des résultats. Ces règlements édictés dans un contexte ancien ont certes besoin d'être considérés, mais surtout re-considérés à la lumière des nouveaux contextes et enjeux.
Nous nous contenterons ici de lister les différents points qui font l'objet d'un travail spécifique au sein du projet Mulce, en coopération avec d'autres projets, et sont en rapport avec le constituant " Licence " introduit en section 2 :
- La licence de dépôt, celle que les responsables de corpus signeront au moment du dépôt de corpus ou d'analyses. Elle stipulera la reconnaissance du travail des auteurs / contributeurs ayant permis de créer l'objet du dépôt, la cession non exclusive dans le respect des droits sur les matériaux engagés, l'acceptation de la mise en accès libre conformément à la licence d'utilisation, en distinguant éventuellement au sein des matériaux ce qui est directement accessible aux internautes anonymes et ce qui doit être réservé aux chercheurs et éducateurs identifiés. Enfin, le responsable devra garantir être en possession de l'ensemble des contrats de cession des droits signés par les acteurs de la formation et de la table reliant codes d'acteurs dans la partie diffusée et identités dans la partie conservée par l'institution d'origine (cf. licence privée en figure 3).
- La licence d'utilisation pour les utilisateurs en distinguant celle pour les anonymes et celle pour les institutionnels (chercheur / pédagogue). Cette licence sera choisie parmi les différentes variantes des Creative Commons.
- La procédure d'anonymisation (Reffay et Teutsch, 2007) (Mondada, 2005) dont la spécification doit trouver l'équilibre entre le respect d'un certain type d'anonymat des acteurs, la possibilité de semi-automatiser cette procédure pour retoucher aux ressources primaires en évitant le remplacement de tokens par des informations qui pourraient biaiser l'interprétation des chercheurs (par exemple, en remplaçant un patronyme par un autre inventé) et en indiquant précisément les sections des données ayant été modifiées.
- Les contrats type d'éthique et de cession des droits, avec d'éventuels libellés différents suivant les variations de conditions expérimentales qui indiqueront aux responsables de corpus les points sur lesquels ils doivent avoir obtenu le consentement " éclairé " signé des acteurs en garantissant, d'un coté, le respect de l'éthique et des droits des participants avec une indication du niveau d'anonymisation des données et de leurs modalités de circulation et conservation et, de l'autre, une cession non exclusive des droits par ces participants, propriétaires de contenus, afin que les productions correspondantes puissent être utilisées et diffusées suivant les modalités de la licence d'utilisation.
Il est difficile d'aborder en quelques mots la question de l'échange, qui a des abords trompeurs. En effet, dans les discours des individus ou institutions du milieu de la recherche ou du monde professionnel sont exprimées avec force les nécessités de concevoir l'échange au niveau international, d'utiliser des formats d'échange standard, voire normalisés. Mais dans les faits, il est fréquent de voir les actes en désaccord avec les propos. Or, on peut sérieusement s'interroger sur la possibilité de discuter formats et langages associés sans avoir une pratique d'utilisation systématique à une échelle significative au sein de communautés, pratique qui amène à saisir non seulement les limitations de tels formats mais surtout le fait qu'ils soient le résultat d'un long processus de coopération, négociation entre cultures différentes (voir, par exemple, sur le thème du catalogage des ressources pédagogiques (De La Passardière et Jarraud, 2004)). La question de l'échange est d'abord un enjeu sociétal avant d'être une question de puissance d'expression ou de sémantique de langages. L'échelle du temps est un paramètre de tout premier ordre. Ainsi les standards et normes du champ corpus et langage (naturel) mentionnés dans les premières sections de cet article sont le résultat de plus de 20 ans de travaux, commencés avant SGML et encore en développement. Comparativement, les efforts de standardisation en e-formation sont récents. On trouve en particulier dans les derniers travaux du Groupe de travail ISO/JTC 1/SC 36, la proposition ISO/IEC FDIS 19780 de modèle de représentation des interactions textuelles (Friesen & Koga, 2006). Cette spécification, en cours d’approbation au stade de final draft, définit actuellement 20 champs, dont 7 obligatoires. Le corps (ou contenu) de l’interaction n’est pas inclus dans ces champs, mais référencé par l’un d’eux. La structure proposée par le projet Mulce est basée sur des concepts similaires et peut aisément être transcrite dans cette spécification si elle est adoptée.
Par ailleurs, les institutions du domaine de la e-formation (regroupées dans des consortiums comme l'IMS) ont pour priorité de créer les conditions à la mise en place de formations en ligne et à leur duplication sur toute plateforme en garantissant dans un premier temps l'échange à partir de la standardisation des scénarios pédagogiques et des ressources pédagogiques (pour ne mentionner que les deux points les plus importants des chantiers en cours). Les étapes suivant la conception et l'instanciation, étapes intitulées étape de production (Production), étape de diffusion (Delivery), voire legacy pour la partie administrative, sont à l'état de jachère. Il existe donc une sous-détermination importante entre la conception et la conduite effective (run) d'une formation. L'écart devient abyssal si l'on considère la perspective du chercheur-pédagogue qui aimerait estimer l'efficience de la formation et réfléchir sur la pertinence des dispositifs au regard des actions et produits des acteurs de la formation telle qu’elle est envisagée dans (Choquet & Iksal, 2007) par exemple.
Ceci dit, comme pour les questions d’éthique et de droit (section 4.1), nous pensons que ces points doivent faire l'objet d'une discussion approfondie dans notre communauté, en s'appuyant au mieux sur les standards existants, en garantissant la comptabilité avec ceux des communautés plus larges que la nôtre ou contiguës et en avançant pragmatiquement sur une échelle significative.
Voici les standards que nous utilisons ou envisageons d'utiliser dans le projet Mulce.
- Pour le serveur Internet en vue de l'échange des données en accès libre : le protocole de l'Open Archive Initiative (OAI-MPH, 2002). Celui-ci est largement utilisé sur la Toile pour les archives ouvertes. Il garantit l'interopérabilité entre les serveurs de dépôts et les moissonneurs, donc des recherches aisées offertes à tout internaute sur les corpus contenus dans notre serveur.
- Pour les métadonnées les plus générales sur les corpus et sous-corpus, nous utilisons la LOM pour le scénario pédagogique, celle de OLAC (voir ci-après) pour les caractéristiques générales de nos corpus, puis une structure propre pour décrire celles du corpus d'apprentissage, le tout étant imbriqué dans le format général Dublin Core Metadata Initiative (Dublin Core, 2006), norme utilisée pour décrire toute forme de ressource.
- Pour l'échange des données verbales et la description des rôles et langues, les standards de l'Open Language Archives Community (OLAC, 2007), de la Text Encoding Initiative (TEI, 2007) pour l'exportation des textes et interactions verbales. OLAC devient un standard pour tous les serveurs contenant des corpus. Les corpus d'apprentissage renfermant des données langagières d'un type nouveau, car produites en situation d'apprentissage, il est important d'en rendre l'accès compatible avec les serveurs de cette large communauté et d'ouvrir ainsi un espace d'investigation nouveau aux chercheurs de ces domaines.
- Pour l'exportation des corpus et sous-corpus entiers, nous avons mentionné en section 2, l'utilisation du standard Content Packaging. Conscients des limites de ce standard qui, du fait de sa conception pour l'agrégation et la désagrégation de ressources pédagogiques, a une gestion des liens et sous-manifestes antinomiques de la mise en relation des différents constituants d'un corpus (cf. section 4.8.4 Package Scope du (IMS-CP, 2004)), nous ne l'utilisons ici que comme empaquetage général des données.
De nombreux travaux de nos communautés (AIED, EIAH et CSCL) sur l’analyse des traces concernent des environnements spécifiques (i.e. : Aplusix (Bouhineau et al., 2001), Logic-ITA (Yacef, 2005)) dans lesquels les productions (algébriques, logiques) sont contraintes par des règles calculables, ce qui en permet une analyse sémantique. Ces environnements proposent des activités d’apprentissage plutôt individuelles, puisque le contenu, riche, interprétable et didactisé peut être traité pour construire automatiquement une rétroaction (feedback) appropriée.
D’autres utilisent des environnements plus généraux (i.e. : Synergo (Avouris et al., 2003), Moodle (Mazza & Milani, 2005)) sur lesquels les chercheurs informaticiens peuvent intervenir pour définir les traces à générer et leur format. La trace obtenue peut alors être visualisée a posteriori par des chercheurs ou à la volée par les acteurs (mirroring). Elle peut subir des traitements ou analyses automatiques pour construire des indicateurs de suivi (monitoring) ou être comparée à un modèle attendu, caractérisant un succès ou une erreur documentée pour construire une rétroaction permettant le guidage (guiding) de l’acteur au cours de l’activité (Jermann et al., 2001). Une modélisation de la trace est proposée dans (Champin et al., 2003). On trouve dans (Settouti et al., 2006), un environnement permettant de transformer et de visualiser cette trace.
Les plateformes de téléformation généralistes se multiplient mais tentent de se normaliser pour intégrer des contenus pédagogiques indépendants (LOM, SCORM) et sont constituées de modules assez génériques (clavardage, forum, wiki, blogues, etc.). Cette diversification de plateformes semble répondre aux exigences culturelles et institutionnelles tandis que leur standardisation et convergence fonctionnelle (au niveau des composants) offrent une meilleure acceptabilité. Cette maturation des plateformes a permis de multiplier les formations en ligne dans de nombreux domaines.
De très nombreuses expérimentations utilisent ces plateformes généralistes (WebCT, Dokeos, Moodle, Lyceum) sans avoir la main sur le processus de génération des traces. Les interactions et productions recueillies concernent, pour une part importante, une communication verbale (textuelle ou non) qui s’inscrit dans un contexte. Les interactions humaines médiées par les plateformes y jouent un rôle essentiel en particulier dans le cas des scénarios d’apprentissage collaboratif. Les analyses quantitatives (Reffay & Chanier, 2003) (Betbeder et al., 2007) apportent quelques indicateurs utiles pour le suivi de l’activité (durée, volume des interactions et productions, fréquence d’accès), mais le besoin d’instrumenter les analyses qualitatives portant sur le contenu lui-même (Betbeder et al., 2008) à travers la recherche de patterns, ou sur le détail des interactions homme-machine sur le poste client (May et al., 2007) pour donner plus de sens à une action (ex : une page ouverte mais non imprimée ou n’ayant jamais défilé pourrait être jugée non complètement lue), se fait de plus en plus pressant.
Les disciplines des sciences humaines s’intéressent à ces analyses (pour celles en langues, voir (Lamy & Hampel, 2007) : chapitre 4), et utilisent souvent des outils de traitement automatiques, que nous avons mentionnés en sections 1 et 2. Ceux-ci fonctionnent assez bien sur des textes bien formés pour tenter d’extraire la sémantique de textes syntaxiquement corrects, mais pour s’adapter aux multiples formes présentes dans les situations écologiques d’apprentissage, ils doivent être enrichis et intégrer des fonctions d’apprentissage automatique dépendantes du contexte (culture, langue, institution, domaine, activité). Pour progresser dans cette voie, la mise à disposition de corpus d’interactions nous semble indispensable. Ces corpus doivent pouvoir intégrer toutes les formes d’interaction effectivement recueillies (Adam et al., 2007), y compris multimodales, éventuellement transcrites.
Pour représenter un ensemble unifié de traces d’interactions dans un environnement multi-acteurs intégrant différents outils ou modalités d’interaction, nous rejoignons Kahrimanis sur la nécessité de définir un format partagé. L’auteur montre dans (Kahrimanis et al., 2006) qu’un tel format est nécessaire pour l’interopérabilité bidirectionnelle entre, d’une part, les plateformes de formation à distance et, d’autre part, les outils d’analyses des traces issues de ces plateformes. De notre côté, puisque nous souhaitons échanger les données en vue de leur analyse, nous mettons l’accent sur la contextualisation et sur les besoins multiples (en terme de format de données) pour leur transcription, annotation, traitement automatique ou analyse. Ces travaux pourront se rapprocher grâce à des coopérations initiées lors d'événements scientifiques tels que le symposium (Reffay, 2007) sur l’échange de corpus organisé à l’occasion du colloque " EPAL 2007 " (Échanger Pour Apprendre en Ligne).
La notion de corpus d’apprentissage a été définie en regard des corpus en linguistique et en traitement automatique du langage. Elle vient élargir celle des traces dans les domaines d’apprentissage assez formels comme les mathématiques et la logique en y ajoutant tout ce qui a trait aux interactions verbales dans tous les domaines d'apprentissage. Les analyses visées sont celles qui cherchent à améliorer les dispositifs d’apprentissage médiatisés, tant dans leur dimension socio-pédagogique, que technique. L’enjeu est celui de la réplicabilité de ces situations d’apprentissage mais aussi et surtout de la validité externe des résultats de recherche. L’objectif central de ce travail est de proposer un cadre suffisant pour rendre accessibles à d’autres les données et résultats de recherche sur ces dispositifs pour en permettre la capitalisation, la comparaison ainsi que la remise en cause par d’autres chercheurs. Les situations d’apprentissage collaboratif sont la cible privilégiée de cette proposition puisqu’elle leur permet de décrire l’ensemble des interactions placées dans le contexte de leur genèse (protocole de recherche, scénario pédagogique, environnement technologique, institution et acteurs). La mise à disposition de corpus issus de situations écologiques est le besoin scientifique et sociétal qui a motivé cette proposition, pour que la recherche sur les interactions (situées) issues de formations en ligne puisse s’appuyer sur des données réelles.
Nous avons déjà entamé la structuration de plusieurs ensembles de données issus de situations pédagogiques et technologiques assez variées dans le domaine de l’apprentissage des langues. La construction du corpus d’apprentissage Simuligne nous a permis d’illustrer ici les schémas XML que nous avons réutilisés (IMS-CP, IMS-LD, IMS-Enterprise) et surtout ceux que nous proposons pour structurer les interactions. La notion de workspace permettant de situer des interactions diversifiées (synchrones / asynchrones ; verbales, iconiques, graphiques, etc.) selon des approches différentes (structures d’activité ou espaces d’échange) rend possible la description de multiples corpus distinguables dans un corpus d’apprentissage.
Enfin, sur le plan technique, la réutilisation des modules de communication (clavardage, wiki, blogue, forum) intégrés dans les plateformes de téléformation ainsi que les recherches de standardisation de traces pour des analyses automatiques interopérables sont des efforts visibles qui confortent les orientations de notre projet.
Les principes fondamentaux de la composition et de la structuration d’un corpus ont été énoncés. La dimension éthique et juridique y joue un rôle essentiel puisqu’elle doit protéger les acteurs et contraindre les usages. Le défi de l’anonymisation systématique est incontournable dans le domaine des interactions humaines situées. La structure opérationnelle Mulce-Struct doit encore être affinée pour rendre possibles les diverses fouilles et recherches, les étiquetages sur les interactions verbales (textuelles ou audio), ainsi que l’alignement entre les données audio ou vidéo et les transcriptions disponibles. La plateforme Mulce devra intégrer des outils standard de traitement ou de fouille des données pour ouvrir la voie à des analyses intra- et inter-corpus. Au sein du projet Mulce, certains partenaires développent de telles analyses et réfléchissent à la façon d'en structurer les résultats pour les intégrer au corpus d'apprentissage.
Ce travail met en évidence les étapes nécessaires pour qu’un corpus devienne partageable. Les efforts actuels de standardisation et cette proposition de structuration offrent une voie possible à ceux qui désirent partager leurs données et confronter leurs analyses. On peut bien sûr trouver, dans chaque recueil de données, des informations spécifiques qui ne seraient pas prévues dans les standards, ou dans une méthode, le besoin de données spécifiques pour éclairer un point de vue particulier de l’analyse. Mais pour avancer, notre domaine de recherche a besoin de pragmatisme. Même s’il n’est pas question (pour l’instant) d’automatiser chaque méthode spécifique ou d’étendre de façon systématique les standards pour intégrer les informations très spécifiques d’un recueil singulier, le choix en particulier de IMS-CP comme format d’archive permet d’inclure et de documenter toutes ces spécificités, ce qui évite d’amputer un recueil de données de ce qui ferait sa singularité et donc sa richesse.
1 Mulce est un projet soutenu par l'Agence Nationale de la Recherche dans le cadre du programme " Corpus et Outils de la Recherche en Sciences Humaines et Sociales » (ANR-06-CORP-006). Il rassemble des équipes des laboratoires LASELDI et LIFC (Université de Franche-Comté), CREET (The Open University) et LIP6 (Université Paris 6), coordonnées respectivement par Thierry Chanier, Christophe Reffay, Marie-Noëlle Lamy et Jean-Gabriel Ganascia.
2 Que ce contexte soit qualifié suivant (Schegloff, 1992) de " distant » (données sur l'apprenant, ses connaissances, le scénario pédagogique, l'institution, etc.) ou "rapproché" (les co-acteurs de l'activité, le focus, le scénario de l'activité, les activités parallèles qui peuvent interférées, etc.)
3 Dans les formations de langue, il est fréquent de faire participer des natifs (personnes nées dans le pays de la langue étudiée) qui servent, pour les apprenants, de référents de la langue et de la culture étudiée.
4 Le formalisme (MOTPlus) s’interprète comme suit : les ellipses représentent des tâches, les rectangles des objets ou concepts. Les liens C sont des liens de Composition, P de Précédence, et I/P Intrant/Produit. Les ellipses foncées (écriture en blanc) dénotent des structures d’activité, celles en vert (fond foncé et écriture en noir) clair des activités d’apprentissage, les jaunes (fond plus clair, écriture noir) des activités de support, les rectangles en fond bleu foncé (avec carré blanc) des objets d’apprentissage ou des produits, ceux en bleu moyen (écriture en blanc, carré gris) des environnements, ceux en fond bleu pâle (écriture noire) des services.
Tous les liens Internet de cette section ont été vérifiés en date du 17 février 2008.
ADAM J.-M., MICHELET S., MARTEL C., DAVID J.-P., GUéRAUD V. (2007). Une infrastructure logicielle pour instrumenter l’expérimentation en EIAH. Dans Nodenot, T., Wallet, J., Fernandes E. (Dir.), Actes de la Conférence EIAH 2007 : Environnements Informatiques pour l’Apprentissage Humain, Lausanne, Suisse, juin, p. 449-454.
AVOURIS N., FIOTAKIS G., KAHRIMANIS G., MARGARITIS M., KOMIS V. (2007). Beyond logging of fingertip actions: analysis of collaborative learning using multiple sources of data. Journal of Interactive Learning Research (Special Issue: Usage Analysis in Learning Systems : Existing Approaches and Scientific Issues), Vol. 18 no 2, p. 231-250. http://hci.ece.upatras.gr/pubs_files/j46_Avouris_etal_JILR_2007.pdf
BELZ, J. A. (2004). Learner corpus analysis and the development of foreign language proficiency. System, Vol. 32 no 4, p. 577–591.
BERLIN (2003). Appel de Berlin d´octobre 2003 sur " Open Access to Knowledge in the Sciences and Humanities ". Munich, Institut Max Planck. http://oa.mpg.de/openaccess-berlin/berlindeclaration.html
BETBEDER M.-L., TISSOT R., REFFAY C. (2007). Recherche de patterns dans un corpus d’actions multimodales. Dans Nodenot, T., Wallet, J., Fernandes E. (Dir.), Actes de la Conférence EIAH 2007 : Environnements Informatiques pour l’Apprentissage Humain, Lausanne, Suisse, juin, p. 533-544. http://edutice.archives-ouvertes.fr/edutice-00158881
BETBEDER M.-L., CIEKANSKI M., GREFFIER F., REFFAY C., CHANIER T. (2008). Interactions multimodales synchrones issues de formations en ligne : problématiques, méthodologie et analyses. Sciences et Technologies de l'Information et de la Communication pour l'Education et la Formation. Vol 15 (à paraître). http://edutice.archives-ouvertes.fr/edutice-00160314/fr/
BOMMIER-PINCEMIN B. (1999).Diffusion ciblée automatique d'informations : conception et mise en oeuvre d'une linguistique textuelle pour la caractérisation des destinataires et des documents. Thèse de Doctorat en Linguistique, Université Paris IV. Extrait de la thèse en ligne http://www.revue-texto.net/1996-2007/Inedits/Pincemin/These.pdf
BOUHINEAU D., NICAUD J.-F., PAVARD X., SANDER E. (2001). Un micromonde pour aider les élèves à apprendre l’algèbre. Actes des sixièmes journée EIAO, Sciences et Techniques Educatives, Paris Hermès, octobre.
CHAMPIN P.-A., PRIé Y., MILLE A., (2003). MUSETTE: Modelling USEs and Tasks for Tracing Experience. ICCBR’03: Workshop ‘‘From structured cases to unstructured problem solving episodes’’ ICCBR’03: NTNU, p. 279–286. http://liris.cnrs.fr/yannick.prie/download/iccbr2003b.pdf
CHANIER, T. (2004) Archives ouvertes et publication scientifique. Comment mettre en place l'accès libre aux résultats de la recherche ? Paris, L'Harmattan. http://archivesic.ccsd.cnrs.fr/sic_00001103/fr
CHANIER, T., VETTER, A. (2006). Multimodalité et expression en langue étrangère dans une plate-forme audio-synchrone. Apprentissage des langues et Système d'Information et de Communication (Alsic), Vol. 9. http://alsic.u-strasbg.fr/v09/chanier/alsic_v09_08-rec3.htm
CHAPELLE, C.A. (2004). Technology and second language learning: expanding methods and agendas. System, Vol. 32 no 4, p. 593-601.
CHOQUET, C., IKSAL, S. (2007). Modeling Tracks for the Model Driven Re-engineering of a TEL System. Journal of Interactive Learning Research, Vol. 18 no 2, p. 161-184.
CIEKANSKI, M., CHANIER, T. (2008). Developing online multimodal verbal communication to enhance the writing process in an audio-graphic conferencing environment. ReCALL, Vol. 20 no 2, p. 162-182. http://edutice.archives-ouvertes.fr/edutice-00200851/fr/
CLAPI (2007) Site de la banque de corpus sur les interactions verbales. Université Lyon 2 / Cnrs. http://clapi.univ-lyon2.fr
CORBEL, A., GIRARDOT, J.-J., LUND, K. (2006). A method for capitalizing upon and synthesizing analyses of human interactions. In W. van Diggelen & V. Scarano (eds.), Workshop proceedings Exploring the potentials of networked-computing support for face-to-face collaborative learning. EC-TEL 2006 First European Conference on technology Enhanced Learning, October 1, Crete, p. 38-47.
DE LA PASSARDIèRE, B., JARRAUD, P. (2004). ManUeL, un profil d'application du LOM pour C@mpuSciences. Revue STICEF, Vol. 11. http://sticef.univ-lemans.fr/num/vol2004/passardiere-11/sticef_2004_passardiere_11.htm
DUBLIN CORE (2006). Site du Dublin Core Metadata Initiative. http://dublincore.org/
FREEBANK (2007). Site de la banque de corpus constitué en vue d'échanges entre chercheurs en linguistique et traitement automatique du langage. Atilf / CNRS. http://www.loria.fr/projets/freebank
FRIESEN, N., KOGA A. (2006). Text of ISO/IEC FCD 19780-1 Information Technology – Learning, education and training - Collaborative Technology – Collaborative Learning Communication – Part 1: Text-based Communication. ISO/IEC JTC1 SC36 N1429, November.
GOODWIN, C., DURANTI, A. (1992). Rethinking context: An introduction. In Duranti, A et Goowin, C. (Dir.), Rethinking context, Language as an interactive phenomenon. Cambridge, UK, Cambridge University Press, p. 1-42.
GRANGER S., VANDEVETER A., HAMEL M.-J. (2001). Analyse de corpus d'apprenants pour l'ELAO basé sur le TAL. Traitement automatique du langage (Tal), Vol. 42 no 2, p. 609-621.
HENRI, F., CHARLIER, B. (2005). L'analyse des forums de discussion Pour sortir de l'impasse. In Baron G-L., Bruillard E., Sidir M. (Dir.), Symposium Symfonic. Formation et nouveaux instruments de communication. Amiens, Université de Picardie, janvier. http://archive-edutice.ccsd.cnrs.fr/edutice-00000897
IMS-CP (2004) : IMS Content Packaging Best Practice and Implementation Guide, version 1.1.4, IMS Global Learning Consortium, Inc. http://www.imsglobal.org/content/packaging/cpv1p1p4/imscp_bestv1p1p4.html .
IMS-ENTERPRISE (2002). Instruction Management System, The IMS Enterprise v1.1 Final specification, released July 2002. http://www.imsglobal.org/enterprise/
IMS-LD (2003). Instruction Management System, Learning Design Specification Version 1, final specification. IMS Global Learning Consortium, Inc. http://www.imsglobal.org/learningdesign/index.html
JACOBSON, M. (2004). Corpus oraux en linguistique de terrain. Traitement automatique du langage (Tal), Vol. 45, no 2, p. 63-88
JERMANN P., SOLLER A., MUEHLENBROCK M. (2001). From mirroring to guiding: a review of state of art technology for supporting collaborative learning. Proceedings of the European Computer Supported Collaborative Learning Conference. (EU-CSCL'01), Maastricht, Netherlands, 2001.
KAHRIMANIS G., PAPASALOUROS A., AVOURIS N., RETALIS S. (2006). A Model for Interoperability in Computer-Supported Collaborative Learning. ICALT 2006 - The 6th IEEE International Conference on Advanced Learning Technologies. Kerkrade, Netherlands, p. 51-55. http://hci.ece.upatras.gr/pubs_files/C114_Kahrimanis_etal_ICALT2006.pdf
KERN, R. (2000). Literacy and Language Teaching. Oxford: Oxford University Press.
KERN, R., WARE, P., WARSHAUER, M. (2004). Crossing frontiers: New directions in online pedagogy and research. Annual Review of Applied Linguistics, Vol. 24, p. 243-260.
KRAMSCH, C., THORNE, S. L. (2001). Foreign language learning as global communicative practice. In D. Block & D. Cameron (dir.), Globalization and language teaching. Londres, Routledge, p. 83-100.
LAMY, M.-N., HAMPEL, R. (2007). Online Communication in Language Learning and Teaching. New York, Palgrave Macmillan.
LESSIG, L. (2005). L'avenir des idées. Le sort des biens communs à l'heure des réseaux numériques. Lyon, Presses Universitaire de Lyon.
MAY M., GEORGE S., PRéVôT P. (2007). Keeping Tracks of Users’ Activities on Discussion Forum: Reflection and Proposal. Dans M.-N. Lamy, F. Mangenot, E. Nissen (Coord.), Actes du Colloque EPAL 2007 : Echanger Pour Apprendre en Ligne, Grenoble, juin. http://w3.u-grenoble3.fr/epal/pdf/may.pdf
MAZZA R., MILANI C. (2005). Exploring Usage Analysis in Learning Systems: Gaining Insights From Visualisations. In Workshop on Usage analysis in learning systems. 12th International Conference on Artificial Intelligence in Education (AIED 2005). Amsterdam, The Netherlands, July, p. 65-72. http://www.inf.unisi.ch/assistants/mazza/Web_area/Pubblicazioni/ AIED05/aied-ws2005.pdf
MONDADA, L. (2005). Constitution de corpus de parole-en-interaction et respect de la vie privée des enquêtés : une démarche réflexive. Rapport sur le projet " Pour une archive des langues parlées en interaction ". Université Lyon 2 et CNRS. http://icar.univ-lyon2.fr/projets/corinte/documents/Mondada_juridique_MARS05.pdf
MOTPlus (2005). Modélisation par Objets Typés, MOTPlus version 1.6.3. Editeur de modèles de connaissances et de scénarios pédagogiques, développé au Centre de recherche LICEF (Laboratoire en Informatique Cognitive et Environnements de Formation), Télé-Université, Québec. http://www.licef.teluq.uqam.ca/fr/realisations/mot1.htm
MULCE (2007): Site du projet Multimodal Learning Corpus Exchange (2007-2009). http://mulce.univ-fcomte.fr
NORAS M., REFFAY C., BETBEDER M.-L. (2007). Structuration de corpus de formation en ligne en vue de leur échange. In Nodenot, T., Wallet, J., Fernandes E. (Dir.) Conférence EIAH 2007 : Environnements Informatiques pour l’Apprentissage Humain, Lausanne, Suisse, juin, p. 59-64. http://edutice.archives-ouvertes.fr/edutice-00154372
OAI-MPH (2002). The Open Archives Initiative Protocol for Metadata Harvesting. Protocol Version 2.0 of 2002-06-14. Document Version 2002/07/05. Open Archive Initiative. www.openarchives.org/OAI/openarchivesprotocol.html
OLAC (2007). Site de l'Open Language Archives Community. University of Pennsylvania. http://www.language-archives.org/
PLANTIN C., MONDADA, L. (2005). Statuts juridiques, formats et standards, représentativité. Rapport sur le projet " Pour une archive des langues parlées en interaction. " Université Lyon 2 et CNRS. http://icar.univ-lyon2.fr/projets/corinte/documents/Projets/rapport_archives.pdf
REFFAY C. (2007). Symposium : Corpus d'apprentissage en ligne : Conception, réutilisation, échange, Dans M.-N. Lamy, F. Mangenot, E. Nissen (Coord.), Actes du Colloque EPAL 2007 : Echanger Pour Apprendre en Ligne (http://w3.u-grenoble3.fr/epal/). Grenoble, juin. http://mulce.univ-fcomte.fr/epal_symposium/
REFFAY C., BETBEDER M.-L. (2006) Spécificités des plateformes audio-graphiques synchrones dans un dispositif de formation. Dans Dejean-Thircuir, C., Mangenot, F. (Dir.), Le Français dans Le Monde (Numéro thématique Les échanges en ligne dans l’apprentissage et la formation), Juillet 2006, p. 124-128,
REFFAY C. CHANIER, T. (2003). How social network analysis can help to measure cohesion in collaborative distance-learning. In Proceedings.of Computer Supported Collaborative Learning Conference (CSCL'2003), Bergen, Norway, June. Dordrecht, The Netherlands, Kluwer, p. 343-352. http://edutice.archives-ouvertes.fr/edutice-00000422
REFFAY C., TEUTSCH P. (2007). Anonymisation de corpus réutilisables. Prépublication, soumise à EIAH2007, 12 p. http://edutice.archives-ouvertes.fr/edutice-00158877
SALMON-ALT, ROMARY, L., PIERREL, J.-M. (2004). Un modèle générique d'organisation des corpus en ligne. Traitement automatique du langage (Tal), Vol. 45, no 3, p. 145-169.
SCHEGLOFF , E.A. (1992). In another context. In Duranti, A et Goowin, C. (Dir.) Rethinking context. Language as an interactive phenomenon. Cambridge, UK, Cambridge University Press, p. 191-229.
SCORM (2000). Sharable Content Object Reference Model. V1.0 (2000), SCORM 2004 3rd edition. The advanced Distributed Learning. http://www.adlnet.gov/Scorm/index.aspx
TEI (2007). Site du standard The Text Encoding Initiative. http://www.tei-c.org/
THORNE, S. L. (2003). Artifacts and cultures-of-use in intercultural communication. Language Learning & Technology, Vol. 7 no 2, p.38-67.
VALCKE, M., MARTENS, R. (2006). Methodological Issues in Researching CSCL. Special issue of Computers & Education, vol. 46, no 1, p. 1-104.
WEBCT (1998). Site de la plate-forme de téléformation. http://www.blackboard.com/webct
YACEF, K. (2005). The Logic-ITA in the classroom: a medium scale experiment. International Journal on Artificial Intelligence in Education, Vol. 15, p. 41-60.
Christophe REFFAY est maître de conférences en informatique et chercheur au Laboratoire d'Informatique de l'Université de Franche-Comté. Il s'intéresse à l'analyse des interactions dans les situations collaboratives de formation/apprentissage à distance et en ligne et en particulier aux modèles issus des réseaux sociaux. Plus récemment, il s'est aussi préoccupé du recueil, de l'indexation et de la structuration des données issues de telles expérimentations, en vue d'en constituer des corpus échangeables avec des chercheurs extérieurs à l'expérimentation.
Adresse : Laboratoire d'Informatique de l’Université de Franche-Comté (LIFC), 16, route de Gray, F-25030 Besançon cedex.
Courriel : Christophe.Reffay@univ-fcomte.fr
Toile : http://mulce.univ-fcomte.fr
Thierry CHANIER est professeur des universités. Ses domaines d'enseignement et de recherche portent sur l'apprentissage des langues et les systèmes d'information et de communication, sur l'ingénierie de formation. Il étudie plus particulièrement les systèmes de formation à distance et les interactions en ligne sur des sujets tels que l'interculturel, le processus réflexif dans la formation des enseignants, le dialogue dans les environnements multimodaux. Il s'intéresse également à la structuration et aux modalités d'échanges entre chercheurs des corpus d'apprentissage (recueils des interactions, des productions des participants en situation d'apprentissage en ligne, accompagnés des contextes pédagogiques et de recherche).
Adresse : UFR SLHS, Université de Franche-Comté, 32 rue Mégevand, F-25030 Besançon cedex
Courriel : Thierry.Chanier@univ-fcomte.fr
Toile : http://mulce.univ-fcomte.fr
Muriel NORAS est doctorante au Laboratoire d’Informatique de Franche-Comté. Son travail de thèse porte sur la mutualisation pluridisciplinaire de corpus provenant de dispositifs de formation collaborative en ligne.
Adresse : Laboratoire d'Informatique de l’Université de Franche-Comté (LIFC), 16, route de Gray, F-25030 Besançon cedex.
Courriel : muriel.noras@lifc.univ-fcomte.fr
Toile : http://lifc.univ-fcomte.fr/~noras
Marie-Laure BETBEDER est maître de conférences en informatique. Elle s'intéresse à l'analyse des interactions dans les situations collaboratives de formation/apprentissage à distance. Depuis 2006, elle étudie également la structuration des données issues de telles expérimentations, en vue d'en constituer des corpus échangeables avec des chercheurs extérieurs à l'expérimentation. Plus récemment, elle traite de la multi-modalité des interactions en vue de leur représentation et analyse.
Adresse : Laboratoire d'Informatique de l’Université de Franche-Comté (LIFC), 16, route de Gray, F-25030 Besançon cedex.
Courriel : Marie-Laure.Betbeder@univ-fcomte.fr
Toile : http://mulce.univ-fcomte.fr
Christophe REFFAY, Thierry CHANIER, Muriel NORAS, Marie-Laure BETBEDER, Contribution à la structuration de corpus d’apprentissage pour un meilleur partage en recherche, Revue STICEF, Volume 15, 2008, ISSN : 1764-7223, mis en ligne le 14/10/2008, http://sticef.org
© Revue Sciences et Technologies de l´Information et de la Communication pour l´Éducation et la Formation, 2008