THESE - RAMIREZ LUELMO

Nom: 
RAMÍREZ LUELMO
Prénom: 
Sergio Iván
Date d'inscription: 
2019
Titre de la thèse: 
Détection automatique du flow (expérience optimale d'apprentissage) dans un MOOC via des techniques d'apprentissage automatique (Machine Learning) : Flow et Learning Analytics.
Résumé en français: 

Flow « [...] est un état d’épanouissement lié à une profonde implication et au sentiment d’absorption que les personnes ressentent lorsqu’elles sont confrontées à des tâches dont les exigences sont élevées et qu’elles perçoivent que leurs compétences leur permettent de relever ces défis ». L’état de flow est positivement corrélé avec des métriques favorables à l’apprentissage. Ainsi, Csíkszentmihályi (2005) affirme que le flow favorise l’apprentissage et le développement personnel parce que les expériences de concentration profonde et totale sont intrinsèquement gratifiantes.

Cependant, la recherche associant flow dans les MOOC ne fait que débuter alors que la détection du flow reste particulièrement complexe, car tout artefact tentant de le détecter ou de le mesurer contribue inévitablement à le perturber.

L’importance de l’état de flow (en tant qu’état psychologique humain) dans le processus d’apprentissage, en ligne et à distance, nous pousse à proposer un modèle d’apprentissage automatique de détection de flow qui permet une détection de flow fiable, automatique et transparente dans un contexte de MOOC. Nous utilisons des techniques d’apprentissage automatique pour donner du sens aux données multidimensionnelles sans avoir recours à un expert humain en permanence.

Ce projet de recherche se différencie des travaux précédents par l’utilisation d’un modèle théorique de flow et de son instrument de mesure, conçus exprès pour détecter flow directement sans passer par des concepts intermédiaires, ainsi que par l’exploitation de deux ensembles de données d’entrée : l’état de flow auto-rapporté des participants ( n ~9 500), et leurs données de connexion au MOOC (~80 Go), pendant deux ans. Aucune donnée de performance n’est collectée ni utilisée.

Après des filtrages et des prétraitements rigoureux, nous couplons les états de flow auto-rapportés des utilisateurs ( n ~1 500) à leurs données de connexion agrégées (23 variables) pour obtenir deux modèles entraînés d’apprentissage automatique.

Un modèle dit Proof-of-Concept qui corrobore les choix et le bon couplage des méthodes , des instruments de mesure du flow et des techniques d’apprentissage automatique (F1 = 0,851 , AUC ROC = 0,85 , Exactitude = 0,797 , Précision = 0,821 , Rappel = 0,882).
Un modèle dit Prototype qui permet de détecter flow dans un contexte de MOOC de manière abordable (F1 = 0,689 , AUC PR = 0,87 , AUC ROC = 0,68 , Exactitude = 0,605 , Précision = 0,854 , Rappel = 0,578) , rapide (quelques ms/participant) , d’un impact environnemental négligeable (~0.00000237222222 g de CO₂eq par exécution) , automatique (pas d’interventions supplémentaires une fois installé) , et transparente (sans intervention des participants du MOOC).

Ces deux modèles identifient mieux le flow que l’absence de flow : Proof-of-Concept : 58% vs. 22% du total , Prototype : ~44% contre ~17% du total. Or, le Prototype présente une proportion plus élevée de Faux Négatifs (~32 % du total) que des Vrais Négatifs (~17% du total) lorsqu’il est confronté à des données non traitées et jamais vues (le prétraitement des données améliore les métriques mais reconstruit les données d’entrée). Cet écart peut être compris comme un modèle prudent préférant une classification pas-de- flow en cas de doute plutôt qu’une classification flow , ce qui n’est pas nécessairement un comportement indésirable du modèle.

D’ailleurs, nos deux modèles souffrent d’un manque de granularité pour la détection du flow , un obstacle insurmontable intrinsèquement lié à la granularité propre (2 moments) des données d’entraînement.

Les perspectives de ce projet de recherche comprennent la mise en œuvre et la commercialisation du modèle Prototype dans un MOOC pour 1) aboutir sur un tableau de bord du flow , 2) personnaliser le contenu, les activités et le parcours d’apprentissage du MOOC et éventuellement , 3) évaluer l’incidence de la détection du flow dans la personnalisation du MOOC afin de réduire le taux d’abandon du MOOC.

Cette thèse s'inscrit dans le cadre du projet Programme « Investissements d’avenir » ( France 2030 ) géré par l’Agence Nationale de la Recherche (ANR).

Université de rattachement: 
Université de Lille
Laboratoire de rattachement: 
Directeur de thèse: 

Jean Heutte (Trigone-CIREL)
Nour El Mawas (Pixel-CREM)

Cifre: 
Non
Date de soutenance: 
21 septembre, 2023
Composition du jury: 

- Margarida Romero, rapporteure
- Fabien Fenouillet, rapporteur
- Bruno Poellhuber, président
- Annelies Raes, examinatrice
- Nour El Mawas, directrice
- Jean Heutte, directeur


Dernière mise à jour : 1 octobre, 2024 - 18:47