Contact :
infos@sticef.org
|
Apprentissage machine pour la
prédiction de la
réaction émotionnelle de l’apprenant
Soumaya Chaffar, Claude
Frasson Université
de Montréal
|
RÉSUMÉ : Les
émotions jouent un rôle important dans les processus cognitifs,
particulièrement dans des tâches d'apprentissage (Isen, 2000).
Cependant, dans le cadre des Systèmes Tuteurs Intelligents (STI), le
facteur émotionnel n'a été considéré que
récemment. Or, modéliser les réactions émotionnelles
d'un apprenant durant une session d’apprentissage est un
élément essentiel pour les STI afin de permettre au tuteur de
prévoir quand et comment il faut intervenir pour aider l’apprenant
à accomplir sa tâche d’apprentissage dans des meilleures
conditions. Dans cet article, nous cherchons à prédire la
réaction émotionnelle de l’apprenant à un moment
donné de l’apprentissage. Notre approche de prédiction
repose sur les causes qui ont pu déclencher cette émotion et sur
ses facteurs déterminants comme la personnalité par exemple. Nous
proposons alors de résoudre ce problème en utilisant les
algorithmes d’apprentissage machine supervisé et plus
précisément ceux de classement.
MOTS
CLÉS : Émotion,
STI, apprentissage machine supervisé, intervention du tuteur. |
|
ABSTRACT : Emotions
play a crucial role in cognitive processes in particular in learning
tasks
(Isen, 2000). However, the emotional factor has been never taken into
account in
Intelligent Tutoring Systems (ITS) until recently. Nevertheless,
modelling the
learner’s emotional reaction is fundamental for ITSs in order to aid
the
tutor to anticipate when and how to intervene for helping the learner
to achieve
learning in the best conditions. In this paper, we attempt to predict
the
learner’s emotional reaction at a given time of the learning process.
Our
approach of prediction relays on the causal events which could trigger
this
emotion and on its determining factors like the personality for
example. Thus,
we propose to solve this problem by using supervised machine learning
algorithms
and more precisely those of classification.
KEYWORDS : Emotion,
ITS, supervised machine learning, tutor’s intervention |
1.
Introduction
Les dernières
décennies ont été marquées par une évolution
quasi générale du réseau Internet, de nouvelles formes de
l’industrie sont apparues dont notamment le commerce électronique,
le e-Learning, etc. Cette dernière technologie, en
particulier,
n’a cessé de changer au fil des années. Auparavant
l’utilisation de l’ordinateur pour l’apprentissage a
donné naissance, dans les années 60, à
l’Enseignement Assisté par Ordinateur (EAO).
Cependant, ces
systèmes d’EAO étaient limités dans la mesure
où ils présentaient à l’apprenant une succession de
contenu figé et des questions pour tester si le contenu
présenté était bien assimilé. Les faiblesses de ces
systèmes se manifestent alors, d’une part, par l’absence de
diagnostic à la suite des réponses de l’apprenant et
d’autre part par le manque d’interactivité avec ce dernier.
Cela représentait un obstacle pour comprendre les intentions de
l’apprenant et identifier les difficultés qu’il rencontrait.
Avec l’apparition de l’intelligence artificielle à la
conférence de Dartmouth en 1956, une nouvelle génération
d’enseignement est apparue dans les années 70, à savoir,
l’Enseignement Intelligemment Assisté par Ordinateur (EIAO),
appelé aussi Système Tuteur Intelligent (STI). Ces
systèmes se caractérisent généralement par leur
capacité à fournir un enseignement individualisé selon le
degré de connaissance de l’apprenant et à accomplir des
tâches non prévues d’avance, en utilisant des techniques
d’intelligence artificielle afin de ressembler à un tuteur humain.
Or, souvent ces systèmes ne prennent pas en considération le
facteur émotionnel et pourtant divers travaux de recherche ont
montré que l'émotion joue un rôle crucial dans la prise de
décision, les processus cognitifs et la performance (Damasio, 1994), (Goleman, 1995), (Isen, 2000).
Selon
Damasio, l’être humain n’est pas capable de prendre même
de simples décisions sans émotions (Damasio, 1994).
De manière analogue, des chercheurs considèrent que les
systèmes de traitement de l'information ne peuvent pas non plus prendre
des bonnes décisions sans émotions. En effet, Sloman et Croucher
(1987) pensent que les machines intelligentes devraient essentiellement
éprouver des émotions. D'ailleurs, Marvin Minsky déclare
qu’on ne doit pas se demander si des machines intelligentes peuvent
avoir
des émotions, mais plutôt si ces machines peuvent être
intelligentes sans avoir des émotions (Minsky, 1986).
Selon Howard Gardner (1983), l’intelligence ne se limite pas à la
seule mesure de QI (Quotient Intellectuel), mais
comporte plutôt
plusieurs formes d'intelligence dont notamment l’intelligence
émotionnelle (Mayer et
Salovey, 1997), (Goleman, 1995).
Mayer et Salovey (1997) définissent l’intelligence
émotionnelle comme l’habilité de percevoir,
d’évaluer et d’exprimer des émotions permettant
d’améliorer le raisonnement, de comprendre les émotions et
les connaissances émotionnelles et de réguler les émotions.
Vu l'importance des émotions, nous désirons ajouter aux
STI des
capacités d’intelligence émotionnelle. Dans cet article,
nous nous concentrons seulement sur une capacité de l’intelligence
émotionnelle entre autres la reconnaissance (prédiction) des
émotions puisque elles ont des influences sur plusieurs processus
cognitifs tels que l’attention, la mémorisation à long
terme, la prise de décision, etc. (Isen, 1999), (Damasio, 1994).
Les émotions positives jouent un rôle important pour
améliorer la créativité et la flexibilité dans la
résolution des problèmes (Isen, 2000).
Par
contre, les émotions négatives peuvent bloquer le fonctionnement
des processus cognitifs. Les gens anxieux ont un déficit dans le
raisonnement inductif, une attention restreinte et une capacité de
mémoire réduite (Isen, 2000).
Peut-on alors prédire la réaction émotionnelle de
l’apprenant ? Dans cet article, nous essayerons de répondre
à cette question en se focalisant sur les causes de cette émotion
et en utilisant des algorithmes d’apprentissage supervisé pour
prédire la réaction émotionnelle de l’apprenant
à la suite de l’intervention du tuteur.
L’organisation de cet article est la suivante :
dans un premier
temps, la deuxième section fournit un état de l’art des
modèles émotionnels existants en portant son attention sur les
modèles computationnels développés. Dans un deuxième
temps, la section 3 décrit notre approche pour prédire la
réaction émotionnelle de l’apprenant. Dans un
troisième temps, la section 4 présente une application de
l’approche tout en montrant une comparaison des différents
algorithmes d’apprentissage machine utilisés dans le but de
prédire la réaction émotionnelle de l’apprenant
à la suite de l’intervention du tuteur. Enfin, dans un dernier
temps, la section 5 sert de conclusion à l’article.
2. Survol
des modèles computationnels des émotions
La majorité des
modèles computationnels des émotions sont fondés sur des
théories existantes en psychologie qui essayent d’expliquer
l’origine des émotions. En effet, plusieurs chercheurs ont
étudié le rôle de la cognition dans la
génération d’émotions. Par exemple, selon la
théorie de l’évaluation (Ortony et al., 1988),
les émotions surgissent à la suite d’évaluations
d’événements dans l’environnement. Cette
théorie est très répandue chez des chercheurs en
informatique et en psychologie et a donné lieu à de nombreux
modèles d'évaluation. Nous en citons quelques uns dans la section
suivante.
2.1. Quelques exemples de modèles d’évaluation
Les modèles d’évaluation sont fondés sur le
principe que les émotions surgissent comme
conséquence
à une évaluation cognitive de l’environnement. Par
exemple, prenons le cas d’une personne qui a gagné un voyage
gratuit en Tunisie en été. Elle commence alors à
évaluer l’événement. Cette évaluation va
peut-être amener la personne à ressentir la joie ou au contraire la
tristesse si la personne ne peut pas partir en voyage cet été. Ces
modèles se caractérisent alors par un certain nombre de
critères que l’être humain considère durant son
évaluation cognitive de l’environnement. Or d’après (Edwards, 1998),
la plupart des auteurs de ces modèles sont d’accord sur certains
critères d’évaluation tels que : l’apparition
d’un nouvel évènement, le type de
l’évènement (imaginaire ou réel), les responsables de
l’évènement (soi-même ou d’autres personnes), la
signification de l’évènement par rapport aux buts de
l’individu (important ou pas), les répercussions de
l’évènement sur les buts et les standards moraux de
l’individu (positifs ou négatifs). Par exemple, prenons le cas
d’un étudiant qui vient de recevoir un courriel indiquant
qu’il a eu la note A+ dans un cours. Une émotion
va se
produire chez lui en fonction de son évaluation cognitive. Si
l’évènement est important pour les buts de
l’étudiant (réussir par exemple), il va, peut être,
exprimer de la joie ; si le responsable de l’événement
est l’étudiant lui-même il va peut être ressentir de la
fierté, etc.
Néanmoins, ces modèles diffèrent
généralement par le nombre de critères
d’évaluation à prendre en considération, leur nature
et leur relation avec les émotions. Par exemple, Roseman et
al. (1990) a créé un modèle, dans lequel, il a identifié
cinq critères d'évaluation d’événements qui,
selon leurs valeurs, caractérisent treize émotions distinctes. Le
premier critère détermine si une situation est positive ou
négative par rapport aux buts de l’individu. Le deuxième
critère détermine si la situation est en accord ou pas avec
l'état de motivation. Le troisième critère est lié
à la certitude ou l'incertitude de l'événement. Le
quatrième critère définit si une personne se
perçoit, dans une situation donnée, comme forte ou faible. Le
cinquième critère représente l'origine de
l'événement, s’il est lié aux circonstances, ou
plutôt lié à l’individu lui-même ou aux
autres.
Lazarus (1991) a créé un modèle d'évaluation dans
lequel il a unifié l’évaluation (appraisal) et
l’adaptation (coping). En effet, il a distingué
entre deux
types d’évaluation: (1) primaire, celle qui évalue la
pertinence d’un évènement et sa congruence ou non aux buts;
(2) secondaire celle qui évalue ce qui peut ou doit être fait pour
répondre à cet évènement.
Un autre modèle, appelé le modèle Ortony,
Clore et
Collins (OCC), a été créé en 1988 par Ortony,
Clore et Collins (1988); comme ce modèle est très utilisé
par les informaticiens, nous le décrirons plus en détail. Dans ce
modèle, les émotions sont considérées comme des
réactions de valence (positive ou négative) aux perceptions de
l'environnement. Ce dernier se compose d’agents,
d’événements et d’objets. Ainsi, les émotions
surgissent comme conséquence: (1) à la désirabilité
ou pas d'un événement (contentement/mécontentement); (2)
à l'approbation ou à la désapprobation des actions des
agents (approbation/ désapprobation); ou (3) à l'amour ou au rejet
de quelques aspects d'un objet (amour/rejet). Les auteurs du modèle
définissent trois critères d'évaluation: (1) les buts qui
représentent le critère employé pour évaluer des
événements; (2) les standards moraux qui représentent le
critère employé pour évaluer les actions des agents; et (3)
les préférences qui représentent le critère
employé pour évaluer des aspects d’objet. Tous ces
critères sont utilisés pour indiquer vingt-deux types
d'émotion.
Après avoir présenté quelques modèles
d'évaluation, nous examinerons dans la prochaine section certains
travaux
où ces modèles ont été utilisés ou
adaptés selon les applications, principalement dans la communauté
de recherche sur les agents.
2.2. Quelques exemples de modèles computationnels des
émotions
Nous avons déjà indiqué que l'émotion et la
cognition sont largement inter-reliées. En effet, l'émotion est
très importante pour les processus cognitifs, la prise de décision
et les comportements sociaux. Pour cette raison et dans le but de créer
une machine intelligente qui exprime des émotions (Minsky, 1986),
plusieurs modèles computationnels des émotions ont
été réalisés; la majorité de ces
modèles est fondée sur la théorie
d’évaluation. Ils peuvent être divisés en deux
catégories : ceux destinés aux agents virtuels et ceux
destinés à l’utilisateur. Bien qu'ils ne soient pas
exclusifs, les modèles computationnels tendent à se concentrer
exclusivement sur l’une de ces deux perspectives.
2.2.1. Modèles computationnels des émotions destinés
aux agents virtuels
Dans le domaine de l’intelligence artificielle (IA), des
chercheurs se
sont intéressés aux modèles computationnels des
émotions et particulièrement dans la communauté de
recherche sur les agents. Ainsi, une grande partie des recherches ont
visé à inclure les modèles computationnels des
émotions dans les agents virtuels. Par exemple, El-Nasr et ses
collègues ont proposé un modèle computationnel des
émotions qui peut être intégré dans les agents
intelligents (El Nasr et al.,
2000).
Ce modèle s'appelle FLAME (Fuzzy Logic Adaptive Model of
Emotions), il est fondé sur différents modèles
d’évaluation existants, principalement le modèle OCC et le modèle de Roseman. FLAME utilise la méthode de la logique
floue pour représenter des émotions en fonction de la désirabilité d'un évènement perçu et
de sa probabilité d'être réalisé, en se basant
sur des équations définies par Price et ses collègues
(1985) :
Espoir = (1.7 * probabilité0.5) +
(-0.7 *
désirabilité).
La désirabilité est calculée en
fonction de
l'importance du but relié à l'évènement et de
l'impact de l'évènement sur le but en utilisant des règles
floues sous la forme suivante :
Si (Impact (but, événement) est A) et
(Importance (but)
est B)
Alors Désirabilité (événement) est C
L’inconvénient majeur de tels modèles, même
s’ils fournissent un cadre très général pour
caractériser la désirabilité des actions et des
événements, réside dans le fait qu’ils ne peuvent
représenter qu’un nombre relativement restreint d'états
émotionnels tout en assumant des buts fixes (Gratch et
Marsella, 2004).
Pour remédier à cet inconvénient, Gratch et Marsella (2004)
ont proposé un modèle computationnel plus générique.
Ce modèle s'appelle EMA (EMotion and Adaptation), il
est
fondé sur la théorie de Lazarus mentionnée
précédemment. EMA permet, d’une part, de représenter
la relation causale entre les événements (passés,
présents et futurs) et les états du monde courant, et
d’autre part, de représenter le caractère subjectif de
l’évaluation et de l’adaptation.
EMA est la première tentative de modélisation
d’adaptation émotionnelle (la réinterprétation de
l’événement, l'acceptation, etc.) par des agents. Ce
modèle est essentiellement axé sur les buts. Il ne prend pas
toutefois en considération les standards moraux ou les
préférences comme dans le modèle OCC.
Les modèles FLAME et EMA sont destinés principalement à
représenter des émotions destinées aux agents virtuels. Or,
ces modèles sont trop génériques pour modéliser les
réactions émotionnelles de l’apprenant. Pour cela, nous
présentons dans la section suivante les modèles computationnels
d’émotions destinés spécifiquement à
représenter les émotions de l’utilisateur.
2.2.2. Modèles computationnels des émotions destinés
aux utilisateurs
Bien que la modélisation des émotions de l’utilisateur
fasse l’objet d’études récentes, un nombre important
de chercheurs ont tenté de trouver un moyen pour communiquer aux agents
l’état émotionnel de l’utilisateur afin de produire
une réaction adéquate (Ball
et Breeze, 1999 ; Healy et Picard, 2000).
Ces travaux se sont concentrés soit sur une émotion
spécifique (comme le stress), soit sur l’intensité (est-ce
que l’événement a pu déclencher une émotion
forte ou faible ?) et la valence (est-ce que
l’événement a des impacts positifs ou négatifs sur
l’utilisateur ?) des émotions. Par ailleurs, ces
modèles n’ont jamais été évalués avec
des utilisateurs réels (Conati et
Maclare, 2004).
Pour ces raisons, Conati (2002) a développé un modèle
probabiliste prenant en considération des émotions
spécifiques. Ce modèle se fonde sur des réseaux de
décision dynamiques qui intègrent des informations sur les causes
des réactions émotionnelles des étudiants et leurs effets
sur l’expression corporelle. De plus, il découle du modèle OCC et a été conçu pour évaluer les
émotions des étudiants durant leur interaction avec un jeu
éducatif. Alors que, par cette recherche, nous visons plutôt
à prédire la réaction émotionnelle qui se produit
face à un environnement d’apprentissage à distance.
Dans cette section, nous avons présenté un état de
l’art sur les modèles computationnels des émotions. La
théorie d'évaluation, développée par (Ortony et al., 1988),
a servi de base conceptuelle pour la majorité de ces modèles. Dans
la section suivante, nous présentons notre approche de prédiction
émotionnelle.
3. Notre
approche de prédiction émotionnelle
Généralement,
l’être humain
utilise des senseurs pour connaître l’émotion de
l’autre et réagir en fonction de cette émotion. Or, celle-ci
peut être exprimée sous différentes formes : la voix,
les expressions faciales, le comportement ou d’autres moyens
physiologiques. Pour considérer ces différents canaux
émotionnels dans la reconnaissance automatique des émotions,
certains chercheurs ont pensé utiliser une caméra, un microphone
ou des capteurs physiologiques. Par exemple, (Gaelle et al., 2006) ont proposé une architecture d’un système de reconnaissance
des états affectifs à partir de mesures physiques
(accéléromètres) et physiologiques (ECG, EMG...).
L’utilisation d’un seul média pour la reconnaissance
automatique des émotions ne donne pas de bons résultats en
général. C’est pour cela que certains chercheurs (Bianchi et
Lisetti, 2002) ont proposé de combiner différents média afin
d’améliorer la reconnaissance automatique des émotions. Deux
problèmes sont cependant inhérents à ce genre de
méthodes. D’une part, l’utilisation de technologies
sophistiquées dans un contexte d’apprentissage peut gêner
l’apprenant. D’autre part, cela demande des moyens financiers et
techniques importantes. C’est pour ces raisons que nous avons pensé
utiliser des techniques d’apprentissage machine pour la prédiction
de la réaction émotionnelle de l’apprenant (Chaffar et al.,
2006).
3.1.1. Apprentissage machine pour la reconnaissance
d’émotions
L’apprentissage machine est une technique d’intelligence
artificielle permettant à une machine d’apprendre à partir
d’exemples déjà disponibles (Mitchell, 1997).
Il existe trois modes d’apprentissage machine :
l’apprentissage
supervisé, l’apprentissage non supervisé et
l’apprentissage par renforcement. L’apprentissage supervisé
consiste à apprendre une fonction à partir des données
d’entraînement qui sont sous la forme
d’entrées/sorties alors que l’apprentissage non
supervisé consiste à apprendre une fonction à partir des
données d’entrées, la sortie n’est pas
spécifiée. L’apprentissage par renforcement consiste
à trouver, par un processus d’essais et d’erreurs,
l’action optimale à effectuer pour une situation perçue par
un agent.
Notre but est de prédire une émotion spécifique (joie,
colère, etc.) étant donné un nombre d’attributs
individuels bien définis (personnalité, style
d’apprentissage, événement, etc.). On doit alors avoir
recours à l’apprentissage supervisé car on dispose ici des
entrées (attributs) et de sorties (émotions). Or, selon la
variable de sortie, il existe deux tâches principales dans
l’apprentissage supervisé. Si cette variable de sortie est
discrète, on parlera de classement, par contre si elle est continue, on
parlera de régression. Dans notre cas nous allons considérer que
l’émotion est une variable discrète puisque elle prend des
valeurs qualitatives (joie, satisfaction, etc.) tel que stipulé dans le
modèle OCC. Nous sommes donc confrontés à un
problème de classement.
Généralement l’apprentissage supervisé se fait sur
un ensemble de données appelé ensemble d’entraînement
qui peut être décrit sous la forme:
,
où xi est l’entrée représentée par un
vecteur (dit vecteur d’observation) contenant les valeurs des attributs
pour le iième objet et f(xi) est la sortie
de la fonction appliquée sur xi.
Le classement consiste
alors à trouver une fonction h qui soit la plus
proche de f. Dans notre cas, f(x) représente l’émotion
à prédire étant donnée un vecteur d’attributs
individuels x.
Après avoir défini notre but qui est la prédiction
d’une émotion spécifique en fonction d’un ensemble
d’attributs individuels, il s’agit maintenant de choisir un
algorithme de classement afin de réaliser ce but. En effet, en
apprentissage supervisé, il existe différents algorithmes de
classement. On peut citer notamment les arbres de décisions, les
classifieurs bayésiens, les réseaux de neurones, les
méthodes d’apprentissage d’ensemble, etc. Chacune de ces
méthodes possède des avantages spécifiques. Par exemple,
les arbres de décision ont l'avantage d'être compréhensibles
et de permettre une traduction immédiate en termes de règles de
décision. Les méthodes d’apprentissage d’ensemble
comme le boosting, sont des méthodes d’agrégation
de
plusieurs classifieurs et sont très efficaces en pratique et connues
pour
la bonne performance de généralisation. Ces méthodes ont
des capacités réduites pour éviter l’apprentissage
par cœur ou la surévaluation (1) lorsqu’on les applique sur des
données fortement bruitées. Quant aux classifieurs de Bayes, ils
sont faciles à implémenter et permettent aussi de modéliser
l’incertitude, mais ils exigent une connaissance initiale de plusieurs
valeurs de probabilité. De manière générale, les
réseaux de neurones sont très performants en pratique. Leur
problème majeur est qu’ils fonctionnent comme des boites noires et
donc il n’est pas possible d’expliquer exactement comment on a
abouti à un classement donné. Or notre but est de diagnostiquer
les causes d’une émotion donnée. On doit donc comprendre le
mécanisme de classement et choisir un algorithme performant parmi les
algorithmes mentionnés plus haut (arbres de décisions,
méthodes d’ensemble et classifieurs Bayésiens).
3.1.2. Procédure de prédiction émotionnelle
D’après la théorie d’évaluation
définie précédemment, les émotions résultent
de certaines interprétations mentales d’événements ou
de situations. Pour la prédiction d’émotions, nous avons
choisi de nous inspirer du modèle OCC. Ce modèle a
servi de
base pour la majorité des modèles computationnels des
émotions grâce à son succès à simplifier la
représentation des états émotionnels. En plus, il offre un
ensemble clair et distinct des critères d’évaluation (buts,
standards moraux et préférences). Ce modèle est fiable pour
modéliser les émotions des agents virtuels. Mais quand on veut
prédire l’émotion de l’utilisateur, il devient trop
générique. En effet, chaque individu réagit
émotionnellement différent à la suite de
l’arrivé d’un évènement émotionnel (Hess, 2003).
Cette
réaction, selon (Hess, 2003) dépend non seulement de l’évènement, mais en plus de
plusieurs autres facteurs (sexe, émotion courante, etc.).
Pour prédire la réaction émotionnelle de
l’apprenant, nous avons défini tout d’abord un ensemble
d’évènements émotionnels qui peuvent surgir dans une
activité d’apprentissage. Un évènement
émotionnel est un évènement qui peut déclencher une
émotion. Dans le cadre de ce travail de recherche, nous nous limitions
à trois évènements émotionnels (voir tableau 1)
à savoir l’obtention de la note dans un test
d’évaluation, la rétroaction du tuteur et le niveau de
difficulté de la matière. Nous avons choisi ces trois
évènements parce qu’ils sont considérés comme
des facteurs affectant l’émotion d’un étudiant et sa
réussite (Perry et al., 1993).
Évènements
émotionnels
|
Émotions associées |
E1. Obtention de la
note dans un test d’évaluation |
Déception, tristesse, satisfaction, soulagement,
joie |
E2. Rétroaction du tuteur |
Admiration, neutre, joie, honte, tristesse,
reproche, gratification |
E3. Niveau de difficulté de la matière |
Satisfaction, déception, crainte, espoir, fierté,
honte, joie,
tristesse |
Tableau 1. Émotions
associées aux
événements émotionnels
Dans le tableau ci-dessus, nous avons associé à chaque
évènement émotionnel un ensemble initial
d’émotions (tiré du modèle OCC) qui peuvent surgir
après l’arrivée de l’évènement. Par
exemple, l’apprenant peut être déçu, triste,
satisfait, soulagé ou joyeux après avoir eu sa note dans un test
d’évaluation.
Comme on l’a déjà mentionné, la réaction
émotionnelle dépend non seulement de
l’événement émotionnel mais aussi de plusieurs
facteurs individuels (Hess, 2001).
Pour
cela, notre approche de prédiction émotionnelle est fondée
sur l’évènement émotionnel et le modèle de
l’apprenant (voir figure 1). Pour chaque évènement
émotionnel ei, une expérimentation sera
développée pour collecter des données sous forme de
(attributs/émotion). Ceux-ci serviront à entrainer des algorithmes
de classement dans le but de prédire la réaction
émotionnelle de l’apprenant. Les attributs sont composés de
l’évènement émotionnel (obtention de la note,
rétroaction du tuteur, etc.) et des caractéristiques individuelles
de l’apprenant (personnalité, niveau de connaissance, etc.)
Figure 1. Réaction
émotionnelle
dépendante du modèle de l’apprenant et de
l’évènement émotionnel
Le choix des attributs est fait d’une façon incrémentale
et en se basant sur des recherches théoriques. Par exemple, des
recherches en psychologie (Larsen, 1991) ont montré que la réaction émotionnelle à un
stimulus diffère d’une personnalité à l’autre.
Les personnes extraverties sont plus sensibles aux stimuli qui
génèrent des émotions positives, alors que les
névrotiques sont plus sensibles aux stimuli qui génèrent
des émotions négatives (Larsen, 1991).
En plus, l'évaluation d'une situation dépend de
l’état émotionnel courant de l'individu, qui influence
fortement sa perception de la situation (Hess, 2001).
En effet, deux des trois expérimentations ont été
déjà réalisées. La première concernant le
test d’évaluation (Chaffar et al.,
2006) et la deuxième concernant l’intervention du tuteur, celle-ci sera
présentée dans ce qui suit.
4.
Prédiction de la réaction émotionnelle à la
suite de l’intervention du tuteur
Le tuteur est
tenu à garder l’attention
de l’apprenant et à accroître sa motivation et sa performance
durant une session d’apprentissage. Pour cela, le choix de son
intervention est très important pour le processus d’apprentissage.
Une expérimentation est alors développée dans le but de
prédire la réaction émotionnelle de l’apprenant
à la suite d’une intervention positive ou négative ou neutre
de la part du tuteur.
4.1. Problématique
Dans cette expérimentation, nous avons défini un
ensemble A d’attributs individuels.
A={a1,
a2, a3, a4,
a5},
a1 :
représente la personnalité de l’apprenant,
a2 :
représente l’émotion ressentie initialement,
a3 :
représente le type d’intervention utilisée par le tuteur, ce
qui correspond à l’évènement émotionnel,
a4 :
représente la motivation de l’apprenant,
a5 :
représente la réaction émotionnelle à la suite de
l’intervention du tuteur.
Étant donnée un ensemble d’entraînement :
,
où :
xi= {ai1, ai2, ai3, ai4}, et f(xi) = ai5
nous
cherchons à trouver une fonction estimée de f permettant
de
prédire la réaction émotionnelle de
l’apprenant.
4.2. Déroulement de l’expérimentation
Dans le but de prédire la réaction émotionnelle de
l'apprenant à la suite de l’intervention du tuteur, nous avons
développé une expérimentation en ligne visant à
collecter des données qui serviront à entraîner des
algorithmes de classement. Nous avons obtenu 124 participants de
différents sexes et âges. Cette expérimentation est
composée essentiellement de sept étapes principales :
(1) Test de
personnalité
Dans cette étape les
participants sont conviés à remplir
un questionnaire : “Abbreviated form of the Revised Eysenck
Personality Questionnaire” (EPQR-A) (Francis et al.,
1992).
EPQR-A est un test de personnalité composé de vingt-quatre
questions permettant d’identifier la personnalité d'un sujet parmi
un ensemble de traits de personnalité (“Psychoticism”,
“Extraversion”, “Neuroticism”, et “Lie
Scale”). La valeur la plus élevée des quatre traits
mesurés sera considérée comme le trait prédominant
de la personnalité de l'apprenant.
(2) Émotion initiale
Dans cette étape, les
participants sont invités à
choisir leurs émotions courantes parmi un ensemble d'émotions
disponibles. L'ensemble d'émotions est choisi à partir du
modèle OCC. Notre choix des émotions a été
fait sur les émotions résultantes des événements.
Dans ce travail, l’événement représente le type de
l’intervention du tuteur. Les participants pouvaient également
introduire de nouvelles émotions.
(3) Cours d’espagnol
en ligne
Durant cette étape,
nous présentons aux participants un
cours
d’espagnol en ligne (voir figure 2). Ce cours montre comment le verbe
être est conjugué dans la langue espagnole. Nous avons aussi
utilisé la technologie d'agent de Microsoft (Microsoft Agent,
1998) pour créer le tuteur.
Figure 2. Interface
montrant le
cours d'espagnol
(4) Test de questions
à choix multiple
La quatrième étape de
l'expérimentation consiste en un
test qui est composé de cinq questions à choix multiple au sujet
du cours d’espagnol. Chaque réponse correcte vaut un point et
chaque réponse incorrecte vaut 0 points.
(5) Test de motivation
Nous présentons aux
participants, dans cette étape, un
test de
motivation appelé “motivation scale” (Sunder 2000).
Ce
test est composé de dix questions pour vérifier la motivation du
participant quand il a répondu au test de questions à choix
multiple. Les participants doivent répondre selon une échelle de
Likert de cinq points (fortement en désaccord, en désaccord,
neutre, en accord et fortement en accord).
(6) Intervention du
tuteur
Durant cette étape, le
tuteur présente sa rétroaction
selon les réponses de l’apprenant au test de questions à
choix multiple. À partir de la classification donnée de Clariana
(2000) sur les types de rétroactions, notre tuteur utilise la forme
explicative de la rétroaction. Ainsi, pour chaque réponse fausse
à une question, le tuteur montre la bonne réponse avec une
explication. Ensuite, il peut intervenir négativement (blâmer ou
blâmer avec plaisanterie), ou positivement (encourager ou
féliciter) ou neutre (ne rien dire). Trois types d'intervention sont
alors présentés aléatoirement aux participants (positif,
neutre et négatif). La figure ci-dessous montre un exemple de feedback
positif du tuteur (voir figure 3).
Figure 3. Exemple
d'interface
montrant la rétroaction du tuteur
(7) Réaction
émotionnelle de l’apprenant
Dans cette étape, les
participants doivent identifier
leur
émotion résultante après l'intervention du tuteur.
L'ensemble d'émotions utilisé dans cette étape est le
même que celui utilisé dans la deuxième étape.
4.3. Résultats
Après le nettoyage des données, 116 seulement ont
été utilisées pour entraîner des algorithmes
d’apprentissage machine. Ces données sont composées des
valeurs de quatre attributs d’entrée (initial_emotion,
personnality, intervention, motivation) et d’un attribut de sortie
(predictEmotion). Ensuite, nous avons effectué un lissage sur les
valeurs
des attributs (initial_emotion et predictEmotion), par exemple, si un
participant a introduit content, comme émotion finale, on la remplace
par
joie puisque les deux émotions appartiennent à la même
catégorie.
Les données que nous avons collectées dans cette
expérimentation sont représentées dans le tableau suivant
et sont regroupées par l’émotion finale (predictEmotion).
Émotions finales des
apprenants |
Le
type de feedback utilisé par le tuteur |
Total |
Positif |
Neutre |
Négatif |
Neutre |
31 |
15 |
7 |
53 |
Joie |
28 |
15 |
3 |
46 |
Tristesse |
3 |
1 |
1 |
5 |
Honte |
0 |
1 |
3 |
4 |
Fierté |
3 |
0 |
0 |
3 |
Reproche |
0 |
2 |
1 |
3 |
Colère |
0 |
2 |
0 |
2 |
Tableau 2. Émotion
finale versus le type de
rétroaction
D’après ce tableau, la majorité des participants que
nous
avons eus ont une émotion finale neutre ou de joie ce qui va se
répercuter sur les résultats trouvés par la suite.
Afin d’avoir une meilleure connaissance sur les
dépendances
entre les attributs, nous avons effectué une analyse descriptive sur
les
données. Cela, nous permettra de choisir les attributs pertinents pour
l’analyse prédictive.
4.3.1. Analyse descriptive
L’analyse descriptive se compose de trois domaines
différents :
(1) L’analyse
uni-variée : on s’intéressera
ici à étudier la distribution des données par rapport
à une variable bien précise.
(2) L’analyse
bi-variée : permet d’étudier les
dépendances qui peuvent exister entre deux variables.
(3) L’analyse
multi-variée : permet d’étudier
les dépendances entre plusieurs variables.
Dans ce travail de recherche, nous nous intéressons à
l’analyse bi variée puisque que nous cherchons à identifier
les variables pertinentes pour la prédiction de la réaction
émotionnelle et à analyser les dépendances entre nos
variables une à une. Or, il existe différentes méthodes
permettant d’identifier les dépendances entre les variables entre
autres l’information mutuelle qui est définie par:
(1)
Dans le tableau ci-dessous, nous montrons l’information
mutuelle
calculée pour chaque couple de nos attributs (voir tableau 3).
Attr |
Perso. |
Ini_em. |
Interv. |
Motiv. |
Ini_em. |
0,052 |
|
|
|
Interv |
0,019 |
0,071 |
|
|
Motiv. |
0,004 |
0,094 |
0,008 |
|
Pred. |
0,128 |
0,292 |
0,152 |
0,018 |
Tableau 3. Relation
de dépendance par
information mutuelle entre les attributs
Comme il est indiqué sur le tableau ci-dessus,
l’attribut
de l’émotion prédite (pred.) a une bonne relation de
dépendance avec presque tous les attributs sauf celui de la motivation.
Pour cela, nous n’avons pas considéré cet attribut dans
l’entraînement des algorithmes d’apprentissage
supervisé. Nous avons aussi remarqué qu’il existe une faible
relation de dépendance entre les couple de variables
d’entrée (I<0.100), ce qui remplit la
condition
exigée par les classifieurs Bayésiens.
4.3.2. Analyse prédictive
Après avoir étudié les dépendances entre les
attributs, les 116 données ont servi pour entraîner plusieurs
algorithmes de classement afin de trouver les algorithmes les plus
performants.
Un algorithme d’apprentissage est considéré comme performant
s’il est capable de produire des hypothèses faisant de bons
classements pour des exemples non vus. Pour évaluer la performance
d’un algorithme d’apprentissage, il s’agit tout d’abord
de diviser l’ensemble d’exemples en deux sous-ensembles
disjoints : un sous-ensemble d’entraînement et un
sous-ensemble
de test. Le sous-ensemble d’entraînement sert à
entraîner l’algorithme pour générer une
hypothèse et l’ensemble de test sert à mesurer le
pourcentage d’exemples classés correctement par
l’hypothèse. Or cette technique ne donne de bons résultats
que lorsque l’échantillon est très grand puisque la
qualité de l’apprentissage augmente avec la taille de
l’ensemble d’entraînement. La précision de
l’estimation augmente également avec la taille de l’ensemble
de test. Généralement quand la taille de
l’échantillon est petite, on doit procéder par une
validation croisée de dix blocs.
Pour l’entraînement de chaque algorithme, nous avons
utilisé le logiciel Weka (Weka, 2005).
Ce
logiciel dispose d’un ensemble d’algorithmes préalablement
implémentés (dont les algorithmes d’arbre de
décision, ceux d’apprentissage d’ensemble et les classifieurs
bayésiens). Cela, permet de générer des modèles de
classification à partir d’un ensemble de données sous forme
d’entrée/sortie. Ces données ont été
formatées dans le format arff exigé par Weka (voir
figure 4).
Figure 4.
Sous-ensemble de
données sous le format arff exigé par Weka
Afin de valider la performance d’un algorithme par
classe de
prédiction, nous avons utilisé les mesures TP rate et FP
rate.
La mesure de TP rate est calculée à
l’aide de la
formule :
(2)
Où TP est le nombre de vrais positifs et FP est
le nombre de faux
positifs.
La mesure de FP rate est calculée à
l’aide de la
formule:
(3)
Où FP est le nombre de faux positifs et TN est
le nombre de vrais
négatifs.
Nous avons alors comparé différents modèles à
l’aide de la validation croisée de dix blocs. La comparaison est
faite seulement pour les états, neutre et joie puisque pour les autres
émotions, on n’a pas obtenu de mesures significatives vu le nombre
réduit de ces classes. Le tableau ci-dessous montre une comparaison
entre
quatre algorithmes de classement (ID3, J48, NaiveBayes, AdaBoostM1) pour les états, joie et neutre,
fait à
l’aide du logiciel WEKA.
Classes |
ID3 |
J48 |
AdaBoostM1 |
NaivesBayes |
TP |
FP |
TP |
FP |
TP |
FP |
TP |
FP |
Neutre |
0.66 |
0.45 |
0.86 |
0.50 |
0.88 |
0.52 |
0.84 |
0.44 |
Joie |
0.56 |
0.28 |
0.54 |
0.18 |
0.54 |
0.15 |
0.6 |
0.2 |
Tableau 4.
Comparaison entre différents
algorithmes de classement à l'aide de TP rate et FP
rate
D’après le tableau 4, nous observons que
généralement le classifieur Naive de Bayes marche bien pour les
deux classes d’émotions (neutre et joie). Par contre, ID3 est le classifieur le moins performant entre les quatre autres.
Enfin pour l’ensemble des classes, le classifieur naive
de Bayes est le
plus performant parmi les autres, il a eu un taux de précision de
presque
63 % avec une validation croisée de dix blocs.
Avec ces résultats, notre approche de prédiction
émotionnelle constitue un moyen simple et fiable permettant de
prédire la réaction émotionnelle de l’apprenant dans
les environnements d’apprentissage à distance. Cette
méthode est fondée sur l’évènement
émotionnel et les caractéristiques individuelles de
l’apprenant sans avoir recours à des moyens sophistiqués
(camera, senseurs physiologiques, etc.). Ces moyens peuvent d’une part
gêner l’apprenant et d’autre part peuvent coûter cher.
5.
Conclusion
L’objectif
principal de ce travail de
recherche, est de proposer une approche permettant à un STI de
prédire la réaction émotionnelle de l’apprenant
dépendamment de la situation d’apprentissage en cours. Or les
émotions jouent un rôle important dans les traitements cognitifs et
particulièrement dans des tâches d’apprentissage puisque les
émotions, dans le système limbique du cerveau, ont un lien avec la
mémorisation à long terme.
Dans cet article, nous avons fourni un état de la
question sur les
modèles d’évaluation existants. Le modèle OCC a été décrit plus en détail, puisqu’il est le
plus utilisé en informatique et sert essentiellement pour cette
recherche. Ensuite, nous avons décrit les modèles computationnels
des émotions. Il existe deux catégories de modèles
computationnels : ceux destinés à représenter les
émotions des agents virtuels et ceux destinés à
représenter les émotions des utilisateurs. Nous nous situons dans
cette deuxième catégorie puisque nous désirons
prédire la réaction émotionnelle de l’apprenant.
En plus, nous avons présenté dans cet article notre
approche de
prédiction émotionnelle à un instant donné de
l’apprentissage. Pour cela, nous avons utilisé des techniques
d’apprentissage machine supervisé pour prédire la
réaction émotionnelle d’une manière
individualisée, en se basant sur des règles du modèle OCC. Nous avons aussi vu que classifieur naive
de Bayes marche bien
(avec presque 63 % de précision) dans notre cas puisqu’il permet de
faire des bonnes généralisations dans des environnements où
règne l’incertitude comme le nôtre.
Remerciements
Nous
adressons nos remerciements au Fond
Québécois pour la Recherche sur la Nature et la Technologie
(FQRNT) qui finance ce projet. Nous tenons également à remercier
le Fond Québécois pour la Recherche sur la Société
et la Culture (FQRSC) pour avoir supporté ce travail. Nous remercions
aussi Gerardo Cepeda et Nabil Guerouah pour leurs contributions dans le
développement de l’expérimentation.
BIBLIOGRAPHIE
BALL
G., BREESE J. (1999).
Modeling the Emotional State of Computer Users. Workshop on Attitude,
Personality and Emotions in User-Adapted Interaction. User
Modeling
UM’99, Canada.
BIANCHI N., LISETTI C. L.
(2002). Modeling Multimodal
Expression of User’s Affective Subjective Experience. User
Modeling and User Adapted Interaction, Vol. 12 n° 1, p. 49-84.
CHAFFAR S., CHALFOUN P.,
FRASSON C. (2006). La
prédiction de la réaction émotionnelle dans un
environnement d’apprentissage à distance. Colloque
international
TICE'2006, Toulouse, France, October 25-27.
CLARIANA R. B. (1992). The
effects of different feedback
strategies using computer-administered multiple-choice questions as
instruction. 14th Annual Proceedings of
Selected Research Presentations of the
Association for Educational Communications and Technology, p.
154-174.
CONATI C., MACLAREN, H.
(2004). Evaluating A
Probabilistic Model of Student Affect. 7th International
Conference on Intelligent Tutoring Systems, Maceio, Brazil.
CONATI C. (2002).
Probabilistic Assessment of User's
Emotions in Educational Games. Journal of Applied Artificial
Intelligence, special issue on Merging Cognition and Affect
in HCI, Vol. 16,
p. 555-575.
DAMASIO A. (1994). Descartes
Error – Emotion,
Reason and the Human Brain. NY : Putnam Press.
EDWARDS P. (1998). Etude
empirique de déterminants
de la différenciation des émotions et de leur intensité.
PhD thesis, Faculté de Psychologie et des Sciences de l'Education de
l'Université de Genève, Genève.
EL NASR M.S., YEN J. IOREGER.
T.R. (2000) FLAME: Fuzzy
Logic Adaptive Model of Emotions. Autonomous Agents and
Multi-Agents
Systems, Vol. 3, p. 219-257.
FRANCIS L. J., BROWN L. B.,
PHILIPCHAL R. (1992). The
development of an abbreviated form of the Revised Eysenck Personality
Questionnaire (EPQR-A): Its use among students in England, Canada, the
U.S.A.
and Australia. Personality and Individual Differences,
Vol. 13,
p.443-449.
GARDNER H. (1983). Frames
of Mind. New York: Basic
Book Inc.
GOLEMAN D. (1995). Emotional
Intelligence. New
York: Bantam Books.
GRATCH J., MARSELLA S.
(2004). A Domain-independent
framework for modeling emotion. Journal of Cognitive Systems
Research, Vol. 5 n° 4, p. 269-306.
HEALY J., PICARD R. (2000).
SmartCar: Detecting Driver
Stress. 15th International Conference on Pattern Recognition, Barcelona, Spain.
HESS U. (2001). The
experience of emotion: situational
influences on the elicitation and experience of emotions. Emotions,
Qualia,
and Consciousness, A. Kaszniak ed. p.
386-396. Singapore: World
Scientific Publishing.
ISEN A. M. (2000). Positive
Affect and Decision Making. Handbook of Emotions.
ISEN A. M. (1999). Positive
Affect. Handbook of
cognition and emotion.
LARZEN R.J., KETELAAR T.
(1991). Personality and
susceptibility to positive and negative emotional states. Journal
of
Personality and Social Psychology, Vol. 61 n°1, p.132-140.
LAZARUS R. (1991). Emotion
and Adaptation. NY:
Oxford University Press.
LOOSLI G., LEE S., GUIGUE V.,
CANU S., RAKOTOMAMONJY
A. (2006). Perception d'états affectifs et apprentissage. RIA
– Revue d'intelligence artificielle, Edition spéciale Interactions
Emotionnelles, Vol. 20 n°4-5, p.553-582.
MAYER J. D., SALOVEY P.
(1997). What is emotional
intelligence? In P. Salovey & D. Sluyter (Eds). Emotional
Development and
Emotional Intelligence: Implications for Educators, p. 3-31.
New York: Basic
Books.
MICROSOFT AGENT. (1998). Logiciel
informatique. Disponible sur Internet: http://www.microsoft.com/msagent (consulté le 15 Octobre 2006).
MINSKY M. (1986). The
Society of Mind. New York:
Simon and Schuster.
MITCHELL T. (1997). Machine
Learning.
McGraw-Hill.
NYE J. L., BROWER A. M.
(1996). What’s Social
About Social Cognition? Sage Publications, London.
ORTONY A., CLORE G., COLLINS
A. (1988). The Cognitive
Structure of Emotions. Cambridge: University Press.
PERRY P.P, HECHTER F.J.,
MENEC V.H., WEINBERG, L.H.
(1993). Enhancing achievement motivation and performance in college
students: An
attributional retraining perspective. Research in Higher
Education, Vol.
34 n° 6, p.687-723.
ROSEMAN I. J., JOSE P. E.,
SPINDEL M. S. (1990).
Appraisals of Emotion-Eliciting Events: Testing a Theory of Discrete
Emotions. Journal of Personality and Social Psychology,
Vol. 59 n° 5,
p.899-915.
SLOMAN A., CROUCHER M.
(1987). Why Robots will have
emotions. Proceedings of IJCAI-87, p. 197-202.
SUNDER D.L. (2000). Motivation
Scale Background and
Scoring Guide, Center for Assessment and Research Studies,
James Madison
University.
WEKA. (2005). Weka
3: Data Mining Software in
Java. The University of Waikato. Disponible sur Internet: http://www.cs.waikato.ac.nz/~ml/weka (consulté le 15 Janvier 2007).
(1) On parle de
surévaluation (overfitting) s’il y a dans le modèle une
corrélation entre une ou plusieurs variables d’entrée et la
variable de sortie (la classe), qui n’existe que dans
l’échantillon d’apprentissage, et non dans toute la
population.
A
propos des auteurs
Soumaya CHAFFAR est doctorante
au Département
d’Informatique et Recherche Opérationnelle de
l’Université de Montréal. Elle est membre du laboratoire
HERON. Ses recherches portent sur la modélisation des réactions
émotionnelles de l'apprenant dans une session d'apprentissage à
distance. Elle s’interesse à prédire la réaction
émotionnelle de l'apprenant à un moment donné de
l'apprentissage et à développer une stratégie
émotionnelle qui va être utilisée par le tuteur dans le
but d'intervenir pour réguler l'émotion de l'apprenant.
Adresse : Université
de
Montréal, DIRO,
Pavillon Andre
Aisenstadt, C.P. 6128, Succ. Centre-Ville, Montreal H3C 3J7 (QC), Canada
Courriel : chaffars@iro.umontreal.ca
Toile : http://www-etud.iro.umontreal.ca/~chaffars/
Claude FRASSON est professeur
titulaire au
Département d’Informatique et Recherche Opérationnelle de
l’Université de Montréal. Il y dirige le laboratoire HERON
et est également directeur du GRITI (Groupe de Recherche
Interuniversitaire en Tuto-riels Intelligents, regroupement de
laboratories
provenant de sept universités québécoises). Ses recherches
se concentrent sur les Systèmes Tutoriels Intelligents et sont
notamment
liées, par ce fait, à l’intelligence artificielle,
l’éducation, la pédagogie, les methods
d’apprentissage, l’ingénierie des connaissances, la gestion
des émotions, le e-Learning et l’apprentissage machine. Claude
Frasson est le fondateur et le président du comité de direction de
la conference internationale ITS qui a lieu tous les deux ans.
Adresse : Université
de
Montréal, Dept. IRO, CP 6128, Succ. Centre-Ville, Montréal,
Québec, Canada, H3C 3J7
Courriel : frasson@iro.umontreal.ca
Toile : http://www.iro.umontreal.ca/~frasson/index.php
|