Sciences et Technologies de l´Information et de la Communication pour l´Éducation et la Formation |
Volume 12, 2005 |
||
Améliorer l'interopérabilité des profils d'application du LOMYolaine Bourda Supélec Nicolas Delestre Laboratoire PSI, Rouen RÉSUMÉ : Depuis Juillet 2002, le LOM est devenu un standard de l'IEEE, mais ce n'est pas le seul schéma de métadonnées pédagogiques existant. En effet, d'autres schémas totalement indépendants sont aussi utilisés, et depuis quelques mois de nombreux schémas issus du LOM apparaissent : on les nomme des profils d'applications du LOM. Or en les étudiant, on note que l'interopérabilité entre ces schémas n'est plus automatique. Pour résoudre ce problème, nous proposons d'utiliser une méthode définie par la norme ISO11179 qui permet de dissocier l'aspect conceptuel de l'aspect représentation lors de la conception de schéma de métadonnées. Ainsi, grâce à ce modèle, les schémas de description de documents pédagogiques pourraient être considérés comme des instanciations d'un seul et unique modèle conceptuel, et donc devenir intéropérables. MOTS CLÉS : Métadonnée, LOM, ISO11179, interopérabilité ABSTRACT : The IEEE LOM is now standardized since July 2002 but it is not the only one standard used to describe learning objects. Application profiles based on the LOM and other educational metadata schemas coexist. This established fact leads to a lack of interoperability between descriptions based on different schemas. To solve this problem, we propose a solution based on the ISO 11179 standard, allowing the description of a conceptual level independently of any particular representation. Thus, each educational metadata schema can be specified as an "instantiation" of a unique educational conceptual level linking them. KEYWORDS : Metadata, LOM, ISO11179, interoperability
1 Contexte de travail : Les schémas de métadonnées pédagogiquesLes métadonnées pédagogiques facilitent la recherche, l'échange et la gestion des données pédagogiques comme des cours, des éléments de cours, des exercices, des exemples, des transparents, etc. (cf. (Bourda et Hélier, 2000)). L'ensemble d'éléments de métadonnées pédagogiques le plus connu, le LOM (pour Learning Object Metadata) est standardisé depuis Juillet 2002 par l'IEEE (Cf.(P1484a)). Mais, même s’il est largement répandu, le LOM ne répond pas toujours aux besoins des utilisateurs. Depuis plusieurs mois, on voit apparaître de nouveaux schémas basés sur le LOM ou sur d'autres schémas de métadonnées comme le Dublin Core : ce sont des "profils d'application". Plus précisément, Heery et Patel dans (Heery et Patel, 2000) définissent les profils d'application comme étant "des éléments de métadonnées issus d'un ou plusieurs schémas de métadonnées combinés afin d'améliorer et d'optimiser leur utilisation dans un cadre particulier" (Traduction française). De leur côté, (Duval et al., 2002) considèrent que l'objectif d'un profil d'application est "d'adapter et de combiner des schémas existants afin d'obtenir un nouveau schéma pour une application particulière tout en gardant l'interopérabilité avec le ou les schémas de base." Dès lors, comme l'indiquent (Heery et Patel, 2000) et (Duval et al., 2002), un profil d'application peut :
On voit bien à travers cet exemple qu'un même DE, ou du moins un DE qui porte le même nom, peut prendre des valeurs bien différentes. De la même manière, pour CLEO, une illustration est définie comme étant un graphique ou un autre média de présentation. Cela correspond-il à la valeur diagram du LOM, ou à la valeur figure ou encore graph ? Pourquoi de telles différences ? Tout simplement parce que ces schémas de métadonnées sont basés sur des termes et non sur des concepts. En effet aucun d'eux ne définit explicitement les concepts présentés par chaque DE. Il est donc pratiquement impossible de pouvoir traduire automatiquement des DE d'un schéma dans un autre. Comment peut-on résoudre ce problème ? En repensant totalement la conception d'un schéma de métadonnées et en utilisant des méthodes permettant de créer ce dernier de manière non ambiguë : c'est ce que nous proposons de faire en appliquant la méthodologie proposée par la norme ISO11179. Nous allons donc commencer cette analyse en explicitant les caractéristiques de cette norme, en nous intéressant tout particulièrement à la méthodologie proposée. Nous verrons ensuite où se positionne le LOM et ses profils d'application dans le cadre de cette norme. Nous en déduirons que la création de véritables profils d'application intéropérables pour les métadonnées pédagogiques nécessite la création d’un modèle conceptuel. Enfin nous terminerons cet article en présentant un prototype qui cadre le développement de schémas de métadonnées compatibles avec la norme ISO11179. 2 La norme ISO 11179Un des objectifs de la norme ISO11179 est de favoriser la description standardisée des données permettant une compréhension commune de leur sémantique. Elle favorise ainsi leur réutilisation. Cette norme aborde les problèmes liés à la sémantique, la description et l’enregistrement des descriptions des données. La première version de la norme ISO11179 (ISO11179, 2004) date de 1994, et elle est depuis en constante évolution. Cette norme est composée de plusieurs parties :
Figure 1 : Diagramme de classes UML de la classification des éléments par l'ISO11179-2
3 La partie 3 de la norme ISO11179Comme nous venons de le voir, l'objectif de cette norme, surtout sa troisième partie, est de définir une méthode de spécification des schémas de métadonnées. Cette méthode repose sur une modélisation à quatre niveaux :
Étudions plus en détail ces quatre niveaux à travers un exemple basé sur la construction d'un schéma permettant de représenter les noms de pays. 3.1 Le niveau conceptuelC'est à ce niveau, dont le modèle UML est représenté par la figure 2, que l'on identifie toutes les données qui permettent de décrire les entités du domaine considéré. Ces entités sont des instances de object class (plus exactement instances de Concept), reliées entre-elles par des instances de Concept_Relationship et les propriétés de ces entités sont des instances de property. En fait, les termes object class et property ont été utilisés en lieu et place des habituels termes, classes et attributs pour ne pas confondre les classes et attributs du modèle de la norme (représentés à l'aide du langage UML) et les classes et attributs du domaine que l'on veut représenter (qui vont être des instances du diagramme UML de la norme). La relation avec cette vision informatique est tellement forte que dans les exemples proposés par la littérature effectuant une analyse de haut en bas (top-down analysis) comme par exemple (ISOSC32N648), la première étape spécifie un modèle conceptuel en utilisant UML comme langage de représentation. Ensuite, à partir de ce modèle UML sont extraits les éléments de ce niveau conceptuel. On verra dans la dernière partie de ce papier que cela nous aidera à construire une chaîne de production de modèles compatibles avec l'ISO 11179 (du moins la partie 3 de cette dernière). Figure 2 : Diagramme de classes UML du niveau conceptuel de l'ISO11179-3 Par exemple, nous pouvons décrire le concept de pays par quatre propriétés : identifiant, capitale, langues et nombre d'habitants. 3.2 Le niveau métadonnées conceptuellesUne fois le modèle conceptuel défini, il faut identifier les métadonnées qui permettent de décrire les entités du domaine, ainsi que les valeurs conceptuelles que ces dernières pourront prendre. Le terme "conceptuel'' est utilisé car ses valeurs sont en théorie indépendantes de toute représentation, c'est-à-dire de tout contexte d'utilisation, aussi bien linguistique que culturel ou applicatif. Chaque métadonnée conceptuelle (DEC pour (Data Element Concept)) est l’association d'une instance de object class (donc un concept ou une relation entre concepts) et d'une instance de property du niveau précédent (c’est-à-dire du niveau conceptuel). Comme l'indique la figure 3, à chaque DEC est associé un domaine de valeurs conceptuelles possibles (CD pour Conceptual Domain), ce CD pouvant regrouper des valeurs énumérées (plusieurs instances de Value_Meaning) ou pouvant être numérique (au sens large : nombre, date, intervalle, etc.). Figure 3 : Diagramme de classes UML du niveau metadonnées conceptuelles de l'ISO11179-3 Dans notre exemple, nous avons quatre DEC :
3.3 Le niveau représentationLe niveau représentation (Cf. figure 4) décrit quant à lui une utilisation particulière (dans un contexte donné) du modèle précédent. Ainsi tout ou partie des DEC sont projetés vers des Data Element (DE) en explicitant les valeurs que peuvent prendre ces derniers, celles-ci constituent les Value Domain (VD). Ces VD sont des instances des CD du niveau précédent. Figure 4 : Diagramme de classes UML de l'ISO 11179-3 Ainsi dans notre exemple, on peut considérer que la norme 3166 (Cf. (ISO3166-04)) est constituée de plusieurs représentations du modèle conceptuel. En effet, la norme ISO3166 propose d'identifier les noms de pays sous différentes formes : les noms des pays en anglais (version courte ou étendue), les noms des pays en code anglais (2 ou 3 lettres), les noms des pays en français (version courte ou étendue) et les noms des pays en code français 3.4 Le niveau classificationUne fois ces trois premiers niveaux explicités, la norme propose d'organiser ces informations en les associant à une ou plusieurs classifications qui peuvent être hiérarchiques, ontologiques, etc. A ces quatre niveaux, la norme présente différents modèles permettant :
Ce qui peut se résumer par la figure 5. Figure 5 : Classification, gestion organisationnelle et gestion multilingue des éléments de schémas de métadonnées de l’ISO 11179-3 (version traduite et simplifiée) 4 L'ISO 11179, l'interopérabilité, les profils d'application et le LOMDans cette partie, nous allons commencer par montrer en quoi l’utilisation de la méthodologie proposée par l'ISO11179 permet d’assurer l'interopérabilité entre différents schémas de métadonnées. Puis nous allons déterminer le positionnement du LOM et de ses profils d'application dans le cadre défini par cette dernière. 4.1 L'ISO11179 et l'interopérabilité des schémas de métadonnéesComme nous l'avons vu dans la première partie de cet article, l'interopérabilité entre les schémas de métadonnées est un problème important. Que signifie le mot interopérabilité ? Tout simplement le fait qu'une entité référencée dans un système puisse être aussi référencée par un autre système possédant un schéma de métadonnées différent du premier. Ceci oblige à l'heure actuelle à posséder un traducteur qui est capable de transformer les métadonnées issues du premier schéma en métadonnées pour le deuxième schéma. Par extension, cela signifie, que s'il existe n schémas de métadonnées, il faut posséder n*(n-1) traducteurs pour pouvoir être totalement intéropérables : ce n'est pas raisonnable. De plus cela sous-entend l'hypothèse que toute métadonnée d'un schéma de métadonnées a son équivalent dans un autre schéma (équivalent direct ou calculé). A contrario, si l'on utilise la norme ISO 11179, cela implique que nous avons deux niveaux : un niveau conceptuel et un niveau de représentation. En supposant que l'on soit capable de décrire de manière conceptuelle les métadonnées qui caractérisent une ressource, on peut considérer que les schémas de métadonnées sont des représentations de ce schéma de métadonnées conceptuelles. Cela implique alors que pour n systèmes possédant chacun son schéma de métadonnées, il faudra 2n traducteurs : n pour traduire les métadonnées des schémas vers le schéma conceptuel et n autres pour les traductions inverses. 4.2 Qu'est ce qu'un profil d'application pour l'ISO11179 ?Au début de ce document nous avons défini ce qu'était un profil d'application. Cependant le concept de profil d'application n'apparaît pas dans la norme, à quoi correspond-il ? C'est en fait la première définition qui répond à cette question. En effet, un profil d'application a pour objectif "d'améliorer et d'optimiser (un schéma de métadonnées) dans un cadre particulier". Un profil d'application se situe donc au niveau représentation de la norme : le cadre général est fixé (dans notre cas celui des documents pédagogiques) et c'est le contexte (par exemple celui de l'enseignement supérieur en France) qui oblige à faire des adaptations (avec par exemple l'obtention du profil d'application ManUeL (Passardière et Jarraud, 2005)). Par conséquent pour l'ISO11179, un profil d'application est une instance d'un modèle conceptuel. Cette vision est tout à fait compatible avec celles citées plus haut (cf (Heery et Patel, 2000) et (Duval et al., 2002)). 4.3 Positionnement actuel du LOM par rapport à l'ISO11179Comme nous l'avons vu, beaucoup de profils d'application du LOM ont été créés. Ceci signifie que le LOM est alors considéré comme étant le modèle conceptuel de ces schémas de métadonnées. Mais une analyse fine du document des IEEE montre que le LOM ne peut pas être considéré comme tel. Tout d’abord, pour un certain nombre de DE, le LOM définit le vocabulaire, c’est-à-dire la liste des mots, en anglais, qui sont utilisables comme valeurs, ce qui comme nous l’avons vu est du ressort du niveau représentation de la norme. Ensuite, pour d’autres DE correspondants à des dates, le LOM définit aussi comment représenter ces dates (par exemple le DE 3.2.3), ce qui encore une fois est de la responsabilité du niveau représentation de la norme (Cf. page 11 de la partie 1). Enfin, le LOM est présenté sous forme d’un tableau (avec 9 catégories de métadonnées) qui est plus proche du modèle informatique que du modèle conceptuel. Pour preuve, le binding XML (Cf. P1484b) est très proche, pour ne pas dire indentique, à la présentation tabulaire du LOM. Or quel que soit le domaine de modélisation (représentation des connaissances, système de gestion de bases de données, modélisation orientée objet, etc.) nous savons que l’implantation informatique est très différente du modèle conceptuel : on part d’un modèle conceptuel (par exemple que l’on représente avec un schéma entités-associations dans le cas des SGBD), on le transforme (par exemple, toujours dans le cas des SGBD, on en déduit un modèle relationnel, sur lequel on applique différentes transformations pour obtenir les différentes formes normales), pour enfin obtenir le modèle "computationnel" (le modèle physique pour les SGBD). On a donc ici une contradiction sur le positionnement du LOM vis à vis de l'ISO11179 qui est à l'origine des problèmes soulevés dans notre introduction. Cette même contradiction est aussi à l'origine des problèmes linguistiques évoqués dans (Passardière et Jarraud, 2004). Elle est aussi à l'origine de l'uniformité de la structure des profils d'application (excepté le profil d'application ManUeL) alors que dans beaucoup de cas cette structure n'est pas adaptée au contexte d'utilisation. Par exemple le LOM permet de représenter la métadonnée "discipline" via l'utilisation de l'ensemble des DE de la catégorie 9, en donnant comme valeur à un DE particulier (le 9.1, purposes) la valeur "discipline". Or cette organisation est contraire aux habitudes de classification de beaucoup de pays, notamment en France: lorsque l'on veut classer un document pédagogique, la discipline est l'un des premiers critères. Par conséquent si un profil d'application français doit officiellement exister, il doit comporter un DE "discipline". Or en dehors de ManUeL, aucun profil d’application ne le propose. 4.4 MLR : un modèle conceptuel pour les schémas de métadonnées pédagogiquesLe LOM a été proposé au comité de normalisation internationnal « ISO/IEC JTC1 SC36 (Information Technology for learning, Education and Training)» afin d’être normalisé. La procédure rapide, et donc sans modification, a été refusée par les pays membres du SC36. A la suite de ce refus, un projet de norme MLR (Metadata for Learning Ressources) a été commencé par l’ISO. Cette future norme doit respecter les investissements réalisés autour du LOM et donc ses implémentations actuelles et prendre en compte des demandes de modifications. Le problème peut donc être formulé de la façon suivante : comment être compatible avec le LOM tout en le modifiant. La solution retenue, par le groupe d'experts GE4 (groupe de travail métadonnées) de la CN36 (commission de normalisation « technologies de l’information pour l’éducation, la formation et l’apprentissage ») de l'Afnor, et proposée par la France à l'ISO met le LOM au même niveau que ses profils d’application et le situe donc au niveau représentation de la norme ISO 11179. Il faut donc définir un modèle conceptuel qui permette d'engendrer tous les schémas pédagogiques, aussi bien le LOM que ses profils d’applications ou que d’autres schémas. C’est ce modèle conceptuel qui constituera le MLR A l’heure actuelle, une première version de ce modèle conceptuel est en cours de spécification par le groupe GE4 de la CN36 de l'Afnor afin d’être soumis à l’ISO. La méthode retenue repose sur :
Par conséquent, nous effectuons à la fois une analyse descendante (top-down) afin d'être le plus exhaustif possible, et une analyse ascendante (bottom-up) afin de prendre en compte les particularités des schémas existants. Par exemple, le DEC 5.2 du LOM, vu dans la première partie de ce document, est présent dans le MLR à travers trois DEC, deux issus de l'analyse descendante (un DEC pour représenter le type physique des documents et un autre pour représenter le type pédagogique) et un troisième issu de l'analyse ascendante (qui est l'union des deux premiers d'un point de vue DEC et CD) dont l’élément 5.2 du LOM sera une représentation.. Cette méthode permet d’obtenir le niveau conceptuel de la norme ISO 11179, c’est-à-dire un diagramme de classes. La définition de domaines conceptuels assurera le niveau métadonnées conceptuelles, c’est-à-dire le MLR. Le LOM constituera alors un des niveaux suivants possibles et pourra alors être redéfini à partir du MLR. 5 Un outil de production basé sur XMLUne fois le schéma de métadonnées conceptuel créé, comment être sûr que le schéma de métadonnées effectif est compatible avec le niveau conceptuel ? C'est en voulant répondre à cette question, que nous avons modélisé et commencé à implanter un outil basé sur une utilisation des technologies XML. En effet, produire un schéma compatible avec la norme en suivant une analyse top-down peut être, comme nous l'avons vu, décomposé en 4 étapes :
On voit alors apparaître que les entités d'un niveau x peuvent être déduites de celles du niveau x-1. D'un point de vue informatique, on peut même dire que les entités d'un niveau x sont des instances des classes identifiées à un niveau x-1 (elles-mêmes instances des classes issues du niveau x-2). Or la création de schémas revient à produire un ensemble de documents comme le montre par exemple (ISN, 2001), cela revient donc à dire que la grammaire d'un document pour un niveau x est d'une part, issue du document défini au niveau x-1, et d'autre part cadrée par le modèle défini par la norme. C'est à partir de ces constats que nous avons décidé d'utiliser les technologies XML. En effet, les schémas XML (XSD) sont un modèle de création de grammaire pour les documents XML. Ce modèle a la particularité d'être lui-même défini à l'aide du langage XML et de proposer des mécanismes de modélisation de haut niveau (modularité, héritage, typage fort, etc.). Ainsi les grammaires définies à un niveau x peuvent être issues d'un document XML défini à un niveau x-1 tout en utilisant des entités (définies par la norme) grâce au concept d'héritage. Cette génération, indépendante du schéma que l'on est en train de définir, peut être obtenue à l'aide du langage de transformation XSL-T, défini lui aussi à l'aide du langage XML. Cette dernière caractéristique permet, lorsque le besoin s'en fait sentir, de pouvoir générer automatiquement des feuilles de transformation XSL-T à partir d'autres feuilles de transformation XSL-T. Ainsi, l'architecture de notre outil de production de schéma de métadonnées compatible avec l'ISO11179-3 est présentée par la figure 6. Figure 6 : Architecture de l'outil de production de schéma compatible avec l'ISO11179-3 On commence par établir le diagramme de classes décrivant le domaine que l'on veut représenter à l'aide des logiciels ad-hoc (comme par exemple ArgoUML, Objectering ou Rational Rose). On obtient alors un document XML correspondant à ce modèle (plusieurs formats sont disponibles, par exemple XMI ou UXF). À partir de ce fichier, par transformation XSL-T, on obtient un fichier XML décrivant l'ensemble des object class et property disponibles. La validation de ce fichier XML est alors contrôlée par un fichier XSD directement issu de la norme. Si on le désire, à ce niveau, on peut générer de la documentation au format PDF à l'aide de XSL-FO (ou autre par exemple XHTML, LaTeX, DocBook, etc.). Ce même principe est répété au niveau supérieur pour la production des DEC et CD : un fichier XML, contenant par défaut l'ensemble des DEC issus des object class et property, est généré (Cf. Tableau 1 pour notre exemple sur le nom de pays). Il suffit de le compléter en :
Au dernier niveau ce n'est pas un fichier XML qui est généré mais une grammaire cadrant la création de schémas de métadonnées. En effet, à ce niveau, le niveau représentation, le concepteur du schéma n'est pas obligé de représenter l'ensemble des DEC en DE, mais les seuls DE qu'il puisse créer doivent être issus des DEC spécifiés au niveau précédent. Du point de vue XML, les seules balises utilisables sont issues des DEC (Cf. Tableau 2 toujours sur l'exemple des noms de pays).
Tableau 1 : Exemple de DEC et de CD
Tableau 2 : Exemple de DE et de VD Actuellement seules certaines parties de cette architecture ont été développées et testées sur l’exemple utilisé dans cet article. Plus précisément, le schéma XSD du niveau DEC-CD a été défini dans une version simplifiée, c’est-à-dire sans les attributs faisant référence à l’administration des métadonnées dans l’entrepôt de métadonnées. Ensuite, ont aussi été développées les feuilles de transformations XSL-T qui génèrent automatiquement le schéma XSD du niveau DE-VD. Enfin, un ensemble de feuilles XSL-T qui génère une version humainement lisible au format PDF (à l’image des exemples que l’on peut trouver sur (ISN, 2001)) a aussi été développé. Lorsque cet outil sera terminé, il permettra d'une part la création de schémas de métadonnées compatibles avec l'ISO11179-3, puisque le concepteur du-dit schéma sera guidé par une grammaire, et d'autre part de générer automatiquement les documents décrivant ce schéma dans différents formats (HTML, PDF, etc.). Cette architecture ouverte, indépendante du domaine d’application, forme l’originalité de ce prototype. 6 ConclusionLa standardisation du LOM par l'IEEE ne supprime pas les problèmes d'intéropérabilité entre les différents schémas de métadonnées. Certains profils d'application du LOM mettent sous le même nom (le même élément de métadonnées) des concepts différents. Parfois, les concepts sont les mêmes mais les vocabulaires sont différents. La solution que nous proposons est basée sur la norme ISO11179 et sépare l'aspect conceptuel de l'aspect représentation. Ainsi le pivot central permettant une réelle intéropérabilité n'est plus le LOM mais un modèle conceptuel indépendant de toute représentation et le LOM devient une représentation comme une autre. Cette démarche, proposée par le GE4, permet ainsi d’obtenir d’une part des éléments de métadonnées clairement définis et, d’autre part, des valeurs possibles pour ces éléments tout aussi clairement définies. Les éléments de métadonnées ainsi obtenus sont donc de meilleure qualité. La mise à disposition de l’outil d'aide à la conception de schéma de métadonnées compatibles avec l'ISO11179 décrit ci-dessus devrait aider le GE4 dans ses travaux. RemerciementsNous remercions deux étudiants du département ASI de l'INSA de Rouen, Céline Capron et Laurent Fallet, pour l'aide qu'ils nous ont apportée pour la conception et le développement de l'outil de production. Nous remercions également les membres du GE4 de la CN36 de l'AFNOR. BIBLIOGRAPHIERéférences bibliographiques
|
|||
Référence de l´article :
Yolaine Bourda, Nicolas Delestre, Améliorer l'interopérabilité des profils d'application du LOM, Revue STICEF, Volume 12, 2005, ISSN : 1764-7223, mis en ligne le 20/10/2005, http://sticef.org © Revue Sciences et Technologies de l´Information et de la Communication pour l´Éducation et la Formation, 2005 |