Sciences et Technologies
de l´Information et
de la Communication pour
l´Éducation et la Formation
 

Volume 12, 2005
Article de recherche

Améliorer l'interopérabilité des profils d'application du LOM

Yolaine Bourda Supélec

Nicolas Delestre Laboratoire PSI, Rouen

RÉSUMÉ : Depuis Juillet 2002, le LOM est devenu un standard de l'IEEE, mais ce n'est pas le seul schéma de métadonnées pédagogiques existant. En effet, d'autres schémas totalement indépendants sont aussi utilisés, et depuis quelques mois de nombreux schémas issus du LOM apparaissent : on les nomme des profils d'applications du LOM. Or en les étudiant, on note que l'interopérabilité entre ces schémas n'est plus automatique. Pour résoudre ce problème, nous proposons d'utiliser une méthode définie par la norme ISO11179 qui permet de dissocier l'aspect conceptuel de l'aspect représentation lors de la conception de schéma de métadonnées. Ainsi, grâce à ce modèle, les schémas de description de documents pédagogiques pourraient être considérés comme des instanciations d'un seul et unique modèle conceptuel, et donc devenir intéropérables.

MOTS CLÉS : Métadonnée, LOM, ISO11179, interopérabilité

ABSTRACT : The IEEE LOM is now standardized since July 2002 but it is not the only one standard used to describe learning objects. Application profiles based on the LOM and other educational metadata schemas coexist. This established fact leads to a lack of interoperability between descriptions based on different schemas. To solve this problem, we propose a solution based on the ISO 11179 standard, allowing the description of a conceptual level independently of any particular representation. Thus, each educational metadata schema can be specified as an "instantiation" of a unique educational conceptual level linking them.

KEYWORDS : Metadata, LOM, ISO11179, interoperability

1 Contexte de travail : Les schémas de métadonnées pédagogiques

Les métadonnées pédagogiques facilitent la recherche, l'échange et la gestion des données pédagogiques comme des cours, des éléments de cours, des exercices, des exemples, des transparents, etc. (cf. (Bourda et Hélier, 2000)). L'ensemble d'éléments de métadonnées pédagogiques le plus connu, le LOM (pour Learning Object Metadata) est standardisé depuis Juillet 2002 par l'IEEE (Cf.(P1484a)). Mais, même s’il est largement répandu, le LOM ne répond pas toujours aux besoins des utilisateurs. Depuis plusieurs mois, on voit apparaître de nouveaux schémas basés sur le LOM ou sur d'autres schémas de métadonnées comme le Dublin Core : ce sont des "profils d'application". Plus précisément, Heery et Patel dans (Heery et Patel, 2000) définissent les profils d'application comme étant "des éléments de métadonnées issus d'un ou plusieurs schémas de métadonnées combinés afin d'améliorer et d'optimiser leur utilisation dans un cadre particulier" (Traduction française). De leur côté, (Duval et al., 2002) considèrent que l'objectif d'un profil d'application est "d'adapter et de combiner des schémas existants afin d'obtenir un nouveau schéma pour une application particulière tout en gardant l'interopérabilité avec le ou les schémas de base."

Dès lors, comme l'indiquent (Heery et Patel, 2000) et (Duval et al., 2002), un profil d'application peut :

• modifier la définition d'un élément du schéma de métadonnées (que l'on nomme aussi élément de donnée, ou DE pour Data Element) afin, par exemple, de le rendre plus spécifique,

• restreindre l'espace de valeurs d'un DE,

• contraindre un DE à devenir obligatoire alors qu'il était optionnel (mais pas l'inverse),

• définir des relations entre DE,

• ajouter de nouveaux DE (il doit alors les maintenir).

La plupart des profils d'application existants sont en fait des profils d'application basés sur le LOM (SCORM, CLEO, EdNA, Celebrate, etc.), ils devraient donc tous être compatibles les uns avec les autres tant au niveau des DE utilisés (on pourra trouver dans (Friesen et Nirhamo, 2003) une présentation des DE utilisés par le LOM), qu'au niveau du vocabulaire utilisé pour expliciter chaque DE. Est-ce le cas ? Malheureusement non. Pour illustrer ce problème prenons l'élément de donnée nommé Learning Resource Type (DE 5.2 du LOM):

• dans le LOM cet élément est défini de la façon suivante : “Spécifie le type d'un objet pédagogique. Le type dominant est celui qui doit apparaître en premier". Les valeurs associées à ce DE sont, en anglais : exercise, simulation, questionnaire, diagram, figure, graph, index, slide, table, narrative text, exam, experiment, problem statement, self-assessment, lecture. Ce DE peut donc être utilisé pour décrire le type physique d'un document pédagogique aussi bien que son potentiel pédagogique. De plus le LOM définit ce DE comme étant compatible avec le DE nommé type du DCMI (DCMI, 2003) alors que les valeurs admises (toujours en anglais) par ce dernier sont : Collection, Dataset, Event, Image, InteractiveResource, Service, Software, Sound, Text, PhysicalObject, StillImage, MovingImage.

• dans CLEO, ce DE peut prendre les valeurs suivantes : additional resource, analogy, assessment, assessment item, attractor, community, definition, demonstration, example, feedback, glossary, guidance, guideline, illustration, importance, introduction, non example, note, objective, outline, overview, practice, prerequisite, presentation, recall, reference, reinforcement, scenario, summary.

• dans RDN/LTSN (RDN, 2003), ce DE peut prendre les valeurs suivantes : CourseModuleUnitProgramme, ResourcePack, CaseStudy, ActivityExerciseFieldwork, ActivityExerciseFieldworkNotes, ProjectOutline, SimulationModel, StudyGuide, ExaminationTest, QuestionBank, AssessmentItem, LecturePresentation, Glossary, CourseLecture, PresentationNotes, WorkedExample, textbook, Demonstration, Computer-basedTutorial, ReadingList, TeachingTip, CurriculumSyllabus, EducatorGuide, EvaluationForm, EducationalPolicy, EducationalReport, LessonPlan.

• enfin dans le schéma de métadonnées de l'EdNA (EdNA, 2000), ce DE est défini comme étant "la nature ou le genre du contenu de la ressource'' et il peut prendre les valeurs provenant du vocabulaire DCMI ou des valeurs spécifiques d'EdNA venant des vocabulaires edna-document (bibliography, dissertation, guidelines, index, manuscript, policy document, presentation, reference, report, research report, serial), edna-curriculum (activity, assessment, course, curriculum/syllabus, exemplar, lesson plan, online project, training package, unit/module) ou edna-event (conference, exhibition, performance)..

On voit bien à travers cet exemple qu'un même DE, ou du moins un DE qui porte le même nom, peut prendre des valeurs bien différentes.

De la même manière, pour CLEO, une illustration est définie comme étant un graphique ou un autre média de présentation. Cela correspond-il à la valeur diagram du LOM, ou à la valeur figure ou encore graph ?

Pourquoi de telles différences ? Tout simplement parce que ces schémas de métadonnées sont basés sur des termes et non sur des concepts. En effet aucun d'eux ne définit explicitement les concepts présentés par chaque DE. Il est donc pratiquement impossible de pouvoir traduire automatiquement des DE d'un schéma dans un autre.

Comment peut-on résoudre ce problème ? En repensant totalement la conception d'un schéma de métadonnées et en utilisant des méthodes permettant de créer ce dernier de manière non ambiguë : c'est ce que nous proposons de faire en appliquant la méthodologie proposée par la norme ISO11179.

Nous allons donc commencer cette analyse en explicitant les caractéristiques de cette norme, en nous intéressant tout particulièrement à la méthodologie proposée. Nous verrons ensuite où se positionne le LOM et ses profils d'application dans le cadre de cette norme. Nous en déduirons que la création de véritables profils d'application intéropérables pour les métadonnées pédagogiques nécessite la création d’un modèle conceptuel. Enfin nous terminerons cet article en présentant un prototype qui cadre le développement de schémas de métadonnées compatibles avec la norme ISO11179.

2 La norme ISO 11179

Un des objectifs de la norme ISO11179 est de favoriser la description standardisée des données permettant une compréhension commune de leur sémantique. Elle favorise ainsi leur réutilisation. Cette norme aborde les problèmes liés à la sémantique, la description et l’enregistrement des descriptions des données.

La première version de la norme ISO11179 (ISO11179, 2004) date de 1994, et elle est depuis en constante évolution. Cette norme est composée de plusieurs parties :

• "Cadre de la spécification et de la normalisation des éléments de données"1 qui définit :

• le cadre d'utilisation de cette norme;

• les différents concepts manipulés par cette norme,

• l'idée fondatrice de cette norme qui est la décomposition de la définition d'un schéma de métadonnées en plusieurs niveaux.

• "Classification des éléments de donnée"2 qui définit comment classer/indexer des différents éléments proposés par cette norme. Cette partie rappelle qu'il y a a priori trois grandes façon d'indexer des éléments (utilisation de mots clés libres, utilisation de mots clés issus d'un thésaurus et enfin utilisation d'une organisation qui relie les éléments les uns aux autres comme par exemple une taxinomie – vision hiérarchique - ou une ontologie – vision réseau). La particularité de cette partie est de différentier l'élément que l'on veut indexer de son image dans une indexation prédéfinie. La figure 1 nous montre qu'un élément peut appartenir à plusieurs schémas de classification et que dans chacun de ces schémas il a une image qui le décrit.

Figure 1 : Diagramme de classes UML de la classification des éléments par l'ISO11179-2

• "Métamodèle de registre et attributs de base" (dernière version finale 2003) que nous allons expliciter par la suite.

• "Règles et directives pour la formulation des définitions des données" (dernière version finale 1995, dernière version de travail 2003) qui définit des règles de bonne pratique pour la définition des différents éléments d'un schéma de métadonnées. Par exemple cette partie préconise que la définition d'un élément doit :

• "être unique",

• "être indiquée au singulier",

• "indiquer ce que l'élément est, pas seulement ce qu'il n'est pas",

• "ne contenir que des abréviations communément comprises",

• etc.

• "Principes de dénomination et d'identification des données"3 qui détermine un protocole de nommage des différents éléments d'un schéma.

• "Enregistrement des éléments de données"4 qui spécifie l'aspect organisationnel de la mise en place d'un schéma de métadonnées en identifiant les acteurs de ce processus et leur rôle.

3 La partie 3 de la norme ISO11179

Comme nous venons de le voir, l'objectif de cette norme, surtout sa troisième partie, est de définir une méthode de spécification des schémas de métadonnées. Cette méthode repose sur une modélisation à quatre niveaux :

• Le niveau conceptuel permettant de définir les concepts et leurs caractéristiques issus du domaine que l'on veut représenter.

• Le niveau métadonnées conceptuelles où l'on identifie les métadonnées du domaine de manière conceptuelle, c'est-à-dire en dehors de tout contexte d'utilisation.

• Le niveau représentation où l'on définit, pour un contexte particulier, comment on représente les métadonnées conceptuelles.

• Le niveau classification qui permet d'organiser les métadonnées.

Étudions plus en détail ces quatre niveaux à travers un exemple basé sur la construction d'un schéma permettant de représenter les noms de pays.

3.1 Le niveau conceptuel

C'est à ce niveau, dont le modèle UML est représenté par la figure 2, que l'on identifie toutes les données qui permettent de décrire les entités du domaine considéré. Ces entités sont des instances de object class (plus exactement instances de Concept), reliées entre-elles par des instances de Concept_Relationship et les propriétés de ces entités sont des instances de property. En fait, les termes object class et property ont été utilisés en lieu et place des habituels termes, classes et attributs pour ne pas confondre les classes et attributs du modèle de la norme (représentés à l'aide du langage UML) et les classes et attributs du domaine que l'on veut représenter (qui vont être des instances du diagramme UML de la norme). La relation avec cette vision informatique est tellement forte que dans les exemples proposés par la littérature effectuant une analyse de haut en bas (top-down analysis) comme par exemple (ISOSC32N648), la première étape spécifie un modèle conceptuel en utilisant UML comme langage de représentation. Ensuite, à partir de ce modèle UML sont extraits les éléments de ce niveau conceptuel. On verra dans la dernière partie de ce papier que cela nous aidera à construire une chaîne de production de modèles compatibles avec l'ISO 11179 (du moins la partie 3 de cette dernière).

images/yb_nd-02.jpg

Figure 2 : Diagramme de classes UML du niveau conceptuel de l'ISO11179-3

Par exemple, nous pouvons décrire le concept de pays par quatre propriétés : identifiant, capitale, langues et nombre d'habitants.

3.2 Le niveau métadonnées conceptuelles

Une fois le modèle conceptuel défini, il faut identifier les métadonnées qui permettent de décrire les entités du domaine, ainsi que les valeurs conceptuelles que ces dernières pourront prendre. Le terme "conceptuel'' est utilisé car ses valeurs sont en théorie indépendantes de toute représentation, c'est-à-dire de tout contexte d'utilisation, aussi bien linguistique que culturel ou applicatif.

Chaque métadonnée conceptuelle (DEC pour (Data Element Concept)) est l’association d'une instance de object class (donc un concept ou une relation entre concepts) et d'une instance de property du niveau précédent (c’est-à-dire du niveau conceptuel). Comme l'indique la figure 3, à chaque DEC est associé un domaine de valeurs conceptuelles possibles (CD pour Conceptual Domain), ce CD pouvant regrouper des valeurs énumérées (plusieurs instances de Value_Meaning) ou pouvant être numérique (au sens large : nombre, date, intervalle, etc.).

images/yb_nd-03.jpg

Figure 3 : Diagramme de classes UML du niveau metadonnées conceptuelles de l'ISO11179-3

Dans notre exemple, nous avons quatre DEC :

• Le DEC "identifiant de pays" dont le domaine conceptuel est énuméré (pour les 230 pays).

• Le DEC "capitale de pays" dont le domaine conceptuel est énuméré.

• Le DEC "langues de pays" dont le domaine conceptuel est énuméré.

• Le DEC "nombre d'habitants d'un pays" dont le domaine conceptuel est non énuméré et de type entier.

3.3 Le niveau représentation

Le niveau représentation (Cf. figure 4) décrit quant à lui une utilisation particulière (dans un contexte donné) du modèle précédent. Ainsi tout ou partie des DEC sont projetés vers des Data Element (DE) en explicitant les valeurs que peuvent prendre ces derniers, celles-ci constituent les Value Domain (VD). Ces VD sont des instances des CD du niveau précédent.

imfig4.jpg

Figure 4 : Diagramme de classes UML de l'ISO 11179-3

Ainsi dans notre exemple, on peut considérer que la norme 3166 (Cf. (ISO3166-04)) est constituée de plusieurs représentations du modèle conceptuel. En effet, la norme ISO3166 propose d'identifier les noms de pays sous différentes formes : les noms des pays en anglais (version courte ou étendue), les noms des pays en code anglais (2 ou 3 lettres), les noms des pays en français (version courte ou étendue) et les noms des pays en code français

3.4 Le niveau classification

Une fois ces trois premiers niveaux explicités, la norme propose d'organiser ces informations en les associant à une ou plusieurs classifications qui peuvent être hiérarchiques, ontologiques, etc.

A ces quatre niveaux, la norme présente différents modèles permettant :

• à une organisation de gérer un schéma de métadonnées, comme le préconise la partie 6 de la norme,

• de gérer l'aspect multilingue d'un schéma.

Ce qui peut se résumer par la figure 5.

images/fig5.jpg

Figure 5 : Classification, gestion organisationnelle et gestion multilingue des éléments de schémas de métadonnées de l’ISO 11179-3 (version traduite et simplifiée)

4 L'ISO 11179, l'interopérabilité, les profils d'application et le LOM

Dans cette partie, nous allons commencer par montrer en quoi l’utilisation de la méthodologie proposée par l'ISO11179 permet d’assurer l'interopérabilité entre différents schémas de métadonnées. Puis nous allons déterminer le positionnement du LOM et de ses profils d'application dans le cadre défini par cette dernière.

4.1 L'ISO11179 et l'interopérabilité des schémas de métadonnées

Comme nous l'avons vu dans la première partie de cet article, l'interopérabilité entre les schémas de métadonnées est un problème important. Que signifie le mot interopérabilité ? Tout simplement le fait qu'une entité référencée dans un système puisse être aussi référencée par un autre système possédant un schéma de métadonnées différent du premier. Ceci oblige à l'heure actuelle à posséder un traducteur qui est capable de transformer les métadonnées issues du premier schéma en métadonnées pour le deuxième schéma. Par extension, cela signifie, que s'il existe n schémas de métadonnées, il faut posséder n*(n-1) traducteurs pour pouvoir être totalement intéropérables : ce n'est pas raisonnable. De plus cela sous-entend l'hypothèse que toute métadonnée d'un schéma de métadonnées a son équivalent dans un autre schéma (équivalent direct ou calculé).

A contrario, si l'on utilise la norme ISO 11179, cela implique que nous avons deux niveaux : un niveau conceptuel et un niveau de représentation. En supposant que l'on soit capable de décrire de manière conceptuelle les métadonnées qui caractérisent une ressource, on peut considérer que les schémas de métadonnées sont des représentations de ce schéma de métadonnées conceptuelles. Cela implique alors que pour n systèmes possédant chacun son schéma de métadonnées, il faudra 2n traducteurs : n pour traduire les métadonnées des schémas vers le schéma conceptuel et n autres pour les traductions inverses.

4.2 Qu'est ce qu'un profil d'application pour l'ISO11179 ?

Au début de ce document nous avons défini ce qu'était un profil d'application. Cependant le concept de profil d'application n'apparaît pas dans la norme, à quoi correspond-il ? C'est en fait la première définition qui répond à cette question. En effet, un profil d'application a pour objectif "d'améliorer et d'optimiser (un schéma de métadonnées) dans un cadre particulier". Un profil d'application se situe donc au niveau représentation de la norme : le cadre général est fixé (dans notre cas celui des documents pédagogiques) et c'est le contexte (par exemple celui de l'enseignement supérieur en France) qui oblige à faire des adaptations (avec par exemple l'obtention du profil d'application ManUeL (Passardière et Jarraud, 2005)). Par conséquent pour l'ISO11179, un profil d'application est une instance d'un modèle conceptuel. Cette vision est tout à fait compatible avec celles citées plus haut (cf (Heery et Patel, 2000) et (Duval et al., 2002)).

4.3 Positionnement actuel du LOM par rapport à l'ISO11179

Comme nous l'avons vu, beaucoup de profils d'application du LOM ont été créés. Ceci signifie que le LOM est alors considéré comme étant le modèle conceptuel de ces schémas de métadonnées. Mais une analyse fine du document des IEEE montre que le LOM ne peut pas être considéré comme tel.

Tout d’abord, pour un certain nombre de DE, le LOM définit le vocabulaire, c’est-à-dire la liste des mots, en anglais, qui sont utilisables comme valeurs, ce qui comme nous l’avons vu est du ressort du niveau représentation de la norme.

Ensuite, pour d’autres DE correspondants à des dates, le LOM définit aussi comment représenter ces dates (par exemple le DE 3.2.3), ce qui encore une fois est de la responsabilité du niveau représentation de la norme (Cf. page 11 de la partie 1).

Enfin, le LOM est présenté sous forme d’un tableau (avec 9 catégories de métadonnées) qui est plus proche du modèle informatique que du modèle conceptuel. Pour preuve, le binding XML (Cf. P1484b) est très proche, pour ne pas dire indentique, à la présentation tabulaire du LOM. Or quel que soit le domaine de modélisation (représentation des connaissances, système de gestion de bases de données, modélisation orientée objet, etc.) nous savons que l’implantation informatique est très différente du modèle conceptuel : on part d’un modèle conceptuel (par exemple que l’on représente avec un schéma entités-associations dans le cas des SGBD), on le transforme (par exemple, toujours dans le cas des SGBD, on en déduit un modèle relationnel, sur lequel on applique différentes transformations pour obtenir les différentes formes normales), pour enfin obtenir le modèle "computationnel" (le modèle physique pour les SGBD).

On a donc ici une contradiction sur le positionnement du LOM vis à vis de l'ISO11179 qui est à l'origine des problèmes soulevés dans notre introduction. Cette même contradiction est aussi à l'origine des problèmes linguistiques évoqués dans (Passardière et Jarraud, 2004). Elle est aussi à l'origine de l'uniformité de la structure des profils d'application (excepté le profil d'application ManUeL) alors que dans beaucoup de cas cette structure n'est pas adaptée au contexte d'utilisation. Par exemple le LOM permet de représenter la métadonnée "discipline" via l'utilisation de l'ensemble des DE de la catégorie 9, en donnant comme valeur à un DE particulier (le 9.1, purposes) la valeur "discipline". Or cette organisation est contraire aux habitudes de classification de beaucoup de pays, notamment en France: lorsque l'on veut classer un document pédagogique, la discipline est l'un des premiers critères. Par conséquent si un profil d'application français doit officiellement exister, il doit comporter un DE "discipline". Or en dehors de ManUeL, aucun profil d’application ne le propose.

4.4 MLR : un modèle conceptuel pour les schémas de métadonnées pédagogiques

Le LOM a été proposé au comité de normalisation internationnal « ISO/IEC JTC1 SC36 (Information Technology for learning, Education and Training)» afin d’être normalisé. La procédure rapide, et donc sans modification, a été refusée par les pays membres du SC36. A la suite de ce refus, un projet de norme MLR (Metadata for Learning Ressources) a été commencé par l’ISO. Cette future norme doit respecter les investissements réalisés autour du LOM et donc ses implémentations actuelles et prendre en compte des demandes de modifications. Le problème peut donc être formulé de la façon suivante : comment être compatible avec le LOM tout en le modifiant. La solution retenue, par le groupe d'experts GE4 (groupe de travail métadonnées) de la CN36 (commission de normalisation « technologies de l’information pour l’éducation, la formation et l’apprentissage ») de l'Afnor, et proposée par la France à l'ISO met le LOM au même niveau que ses profils d’application et le situe donc au niveau représentation de la norme ISO 11179. Il faut donc définir un modèle conceptuel qui permette d'engendrer tous les schémas pédagogiques, aussi bien le LOM que ses profils d’applications ou que d’autres schémas. C’est ce modèle conceptuel qui constituera le MLR

A l’heure actuelle, une première version de ce modèle conceptuel est en cours de spécification par le groupe GE4 de la CN36 de l'Afnor afin d’être soumis à l’ISO. La méthode retenue repose sur :

• la définition d’un ensemble de cas d’utilisations balayant, autant que faire se peut, toutes les utilisations possibles de métadonnées pédagogiques réparties (et donc pour lesquelles l’interopérabilité est fondamentale) ;

• la prise en compte des schémas de métadonnées existant, le LOM bien sûr, mais aussi d’autres, et donc de tous leurs éléments de métadonnées ;

• une classification, en cours, des différentes ressources pédagogiques devant être décrites ainsi que leurs attributs/propriétés.

Par conséquent, nous effectuons à la fois une analyse descendante (top-down) afin d'être le plus exhaustif possible, et une analyse ascendante (bottom-up) afin de prendre en compte les particularités des schémas existants. Par exemple, le DEC 5.2 du LOM, vu dans la première partie de ce document, est présent dans le MLR à travers trois DEC, deux issus de l'analyse descendante (un DEC pour représenter le type physique des documents et un autre pour représenter le type pédagogique) et un troisième issu de l'analyse ascendante (qui est l'union des deux premiers d'un point de vue DEC et CD) dont l’élément 5.2 du LOM sera une représentation..

Cette méthode permet d’obtenir le niveau conceptuel de la norme ISO 11179, c’est-à-dire un diagramme de classes. La définition de domaines conceptuels assurera le niveau métadonnées conceptuelles, c’est-à-dire le MLR. Le LOM constituera alors un des niveaux suivants possibles et pourra alors être redéfini à partir du MLR.

5 Un outil de production basé sur XML

Une fois le schéma de métadonnées conceptuel créé, comment être sûr que le schéma de métadonnées effectif est compatible avec le niveau conceptuel ? C'est en voulant répondre à cette question, que nous avons modélisé et commencé à implanter un outil basé sur une utilisation des technologies XML. En effet, produire un schéma compatible avec la norme en suivant une analyse top-down peut être, comme nous l'avons vu, décomposé en 4 étapes :

• modélisation conceptuelle du monde que l'on veut représenter ;

• identification des object class et property associés ;

• création des DEC avec définition des CD correspondants (des énumérés ou des non-énumérés) ;

• enfin, pour un contexte donné, identification des DE et VD associés.

On voit alors apparaître que les entités d'un niveau x peuvent être déduites de celles du niveau x-1. D'un point de vue informatique, on peut même dire que les entités d'un niveau x sont des instances des classes identifiées à un niveau x-1 (elles-mêmes instances des classes issues du niveau x-2). Or la création de schémas revient à produire un ensemble de documents comme le montre par exemple (ISN, 2001), cela revient donc à dire que la grammaire d'un document pour un niveau x est d'une part, issue du document défini au niveau x-1, et d'autre part cadrée par le modèle défini par la norme.

C'est à partir de ces constats que nous avons décidé d'utiliser les technologies XML. En effet, les schémas XML (XSD) sont un modèle de création de grammaire pour les documents XML. Ce modèle a la particularité d'être lui-même défini à l'aide du langage XML et de proposer des mécanismes de modélisation de haut niveau (modularité, héritage, typage fort, etc.). Ainsi les grammaires définies à un niveau x peuvent être issues d'un document XML défini à un niveau x-1 tout en utilisant des entités (définies par la norme) grâce au concept d'héritage. Cette génération, indépendante du schéma que l'on est en train de définir, peut être obtenue à l'aide du langage de transformation XSL-T, défini lui aussi à l'aide du langage XML. Cette dernière caractéristique permet, lorsque le besoin s'en fait sentir, de pouvoir générer automatiquement des feuilles de transformation XSL-T à partir d'autres feuilles de transformation XSL-T.

Ainsi, l'architecture de notre outil de production de schéma de métadonnées compatible avec l'ISO11179-3 est présentée par la figure 6.

images/fig6.jpg

Figure 6 : Architecture de l'outil de production de schéma compatible avec l'ISO11179-3

On commence par établir le diagramme de classes décrivant le domaine que l'on veut représenter à l'aide des logiciels ad-hoc (comme par exemple ArgoUML, Objectering ou Rational Rose). On obtient alors un document XML correspondant à ce modèle (plusieurs formats sont disponibles, par exemple XMI ou UXF).

À partir de ce fichier, par transformation XSL-T, on obtient un fichier XML décrivant l'ensemble des object class et property disponibles. La validation de ce fichier XML est alors contrôlée par un fichier XSD directement issu de la norme. Si on le désire, à ce niveau, on peut générer de la documentation au format PDF à l'aide de XSL-FO (ou autre par exemple XHTML, LaTeX, DocBook, etc.).

Ce même principe est répété au niveau supérieur pour la production des DEC et CD : un fichier XML, contenant par défaut l'ensemble des DEC issus des object class et property, est généré (Cf. Tableau 1 pour notre exemple sur le nom de pays). Il suffit de le compléter en :

• ajoutant des DEC qui sont issus de l'analyse bottom-up,

• spécifiant les CD.

Au dernier niveau ce n'est pas un fichier XML qui est généré mais une grammaire cadrant la création de schémas de métadonnées. En effet, à ce niveau, le niveau représentation, le concepteur du schéma n'est pas obligé de représenter l'ensemble des DEC en DE, mais les seuls DE qu'il puisse créer doivent être issus des DEC spécifiés au niveau précédent. Du point de vue XML, les seules balises utilisables sont issues des DEC (Cf. Tableau 2 toujours sur l'exemple des noms de pays).

<Data_Element_Concept>
<administered_item_administration_record registration_status="Standard"
administrative_status="Final">
<administered_item_identifier data_identifier="Country" version="">
<item_registration_authority_identifier international_code_designator=""
organization_identifier=""/>
<Enumerated_Conceptual_Domain>
...
<Value_Meaning value_meaning_identifier="1001"
value_meaning_description="The primary geopolitical
entity known as Afghanistan"
value_meaning_begin_date="1997-01-10"/>
<Value_Meaning value_meaning_identifier="1002"
...
</Enumerated_Conceptual_Domain>
</Data_Element_Concept>

Tableau 1 : Exemple de DEC et de CD

<Data_Element_Country>
<administered_item_administration_record registration_status="Standard"
administrative_status="Final">
<administered_item_identifier data_identifier="EnglishShortName"
version="">
<item_registration_authority_identifier international_code_designator=""
organization_identifier=""/>
</administered_item_identifier>
</administered_item_administration_record>
<Enumerated_Value_Domain_Country value_domain_maximum_character_quantity="44"
value_domain_format="A(44)">
...
<value_domain_datatype datatype_name="Alphanumeric"
datatype_scheme_reference=""/>
<value_domain_unit_of_measure unit_of_measure_name=""
unit_of_measure_precision="1"/>
<Permissible_Value_1001 permissible_value_begin_date="1997-01-10">
Afghanistan
</Permissible_Value_1001>
<Permissible_Value_1002 permissible_value_begin_date="1997-01-10">
Albania
</Permissible_Value_1002>
...
</Enumerated_Value_Domain_Country>
</Data_Element_Country>

Tableau 2 : Exemple de DE et de VD

Actuellement seules certaines parties de cette architecture ont été développées et testées sur l’exemple utilisé dans cet article. Plus précisément, le schéma XSD du niveau DEC-CD a été défini dans une version simplifiée, c’est-à-dire sans les attributs faisant référence à l’administration des métadonnées dans l’entrepôt de métadonnées. Ensuite, ont aussi été développées les feuilles de transformations XSL-T qui génèrent automatiquement le schéma XSD du niveau DE-VD. Enfin, un ensemble de feuilles XSL-T qui génère une version humainement lisible au format PDF (à l’image des exemples que l’on peut trouver sur (ISN, 2001)) a aussi été développé.

Lorsque cet outil sera terminé, il permettra d'une part la création de schémas de métadonnées compatibles avec l'ISO11179-3, puisque le concepteur du-dit schéma sera guidé par une grammaire, et d'autre part de générer automatiquement les documents décrivant ce schéma dans différents formats (HTML, PDF, etc.). Cette architecture ouverte, indépendante du domaine d’application, forme l’originalité de ce prototype.

6 Conclusion

La standardisation du LOM par l'IEEE ne supprime pas les problèmes d'intéropérabilité entre les différents schémas de métadonnées. Certains profils d'application du LOM mettent sous le même nom (le même élément de métadonnées) des concepts différents. Parfois, les concepts sont les mêmes mais les vocabulaires sont différents. La solution que nous proposons est basée sur la norme ISO11179 et sépare l'aspect conceptuel de l'aspect représentation. Ainsi le pivot central permettant une réelle intéropérabilité n'est plus le LOM mais un modèle conceptuel indépendant de toute représentation et le LOM devient une représentation comme une autre. Cette démarche, proposée par le GE4, permet ainsi d’obtenir d’une part des éléments de métadonnées clairement définis et, d’autre part, des valeurs possibles pour ces éléments tout aussi clairement définies. Les éléments de métadonnées ainsi obtenus sont donc de meilleure qualité.

La mise à disposition de l’outil d'aide à la conception de schéma de métadonnées compatibles avec l'ISO11179 décrit ci-dessus devrait aider le GE4 dans ses travaux.

Remerciements

Nous remercions deux étudiants du département ASI de l'INSA de Rouen, Céline Capron et Laurent Fallet, pour l'aide qu'ils nous ont apportée pour la conception et le développement de l'outil de production.

Nous remercions également les membres du GE4 de la CN36 de l'AFNOR.

BIBLIOGRAPHIE

Références bibliographiques

Bourda Y., Hélier M. (2000). What metadata and xml can do for learning objects. WebNet Journal, 2(1) :2431, 2000.

Duval E., Hodgins W., Sutton S., Weibel S.L. (2002). Metadata principles and practicalities. D-Lib Magazine, http://www.dlib.org/dlib/april02/weibel/04weibel.html, 2002.

Friesen N., and L. Nirhamo L. (2003). Survey of lom implementations. Preliminary Report. ISO/IEC JTC1 SC36 WG4 N0057, 2003.

R. Heery R., et Patel M. (2000). Application profiles : mixing and matching metadata schemas. Ariadne issue 25, 2000

De La Passardière B., Jarraud P. (2004). ManUeL, un profil d'application de LOM pour C@mpuSciences. Revue STICEF - Sciences et Technologies de l'Information et de la Communication pour l'Education et la Formation, 2004, ISSN 1764-7223, 2004, http://sticef.org. (OAI : oai:archive-edutice.ccsd.cnrs.fr:edutice-00000618_v1) - http://archive-edutice.ccsd.cnrs.fr/edutice-00000618

De La Passardière B., Jarraud P. (2005) ManUeL, LOM et l'indexation de ressources scientifiques, Vers les bonnes pratiques pour l'Université en ligne, Conférence EIAH'2005.

 

Références à des sites Internet

Dublin core metadata initiative type vocabulary., 2003

http://dublincore.org/documents/dcmi-type-vocabulary/ (consulté en mars 2005).

Education network australia, 2000

http://www.edna.edu.au/metadata (consulté en mars 2005).

ISO-SC32-N648. Information technology data management and interchange part 1, 2001.

http://jtc1sc32.org/doc/N0601-0650/N0601-0650.html (consulté en avril 2004)

ISO11179. Information technology - metadata registries (mdr), 2004

http://metadata-standards.org/ (consulté en mars 2005).

ISO3166. Iso 3166 country codes, 2004

http://www.iso.ch/iso/en/prods-services/iso3166ma/index.html (consulté en mars 2005).

IEEE P1484.12.2/D1.Draft standard for learning technology - learning object metadata, 2002.

http://ltsc.ieee.org/wg12/index.html (consulté en mars 2005).

IEEE P1484.12.2/D1.Draft standard for learning technology – Extensible markup Language Schema, Definition Language Binding for LOM 2005. ).

http://ltsc.ieee.org/wg12/materials.html (consulté en mars 2005). ).

Lom application profile. version 1.0., 2003

http://www.rdn.ac.uk/publications/rdn-ltsn/ (consulté en mars 2005).


1 dernière version finale 2004

2 dernière version finale 2000, dernière version de travail 2003

3 dernière version finale 1995, dernière version de travail 2003

4 dernière version 1997, dernière version de travail 2003


A propos des Auteurs

Yolaine BOURDA est Professeur à Supélec et depuis septembre 2005 chef du département d'enseignement et de recherche en informatique de Supélec. Elle s'intéresse actuellement au Web Sémantique et plus particulièrement à ses apports pour l'apprentissage. Elle a travaillé sur les schémas de métadonnées pédagogiques et est co-éditrice de la future norme ISO « Metadata for Learning Resources ».

Adresse : Supélec, Département informatique, Plateau de Moulon, 3 rue Joliot-Curie, 91192 Gif-sur-Yvette CEDEX

Courriel : Yolaine.Bourda@supelec.fr

Nicolas DELESTRE est Maître de Conférences à l'INSA de Rouen et membre du laboratoire PSI (Perception, Systèmes et Information). Il a soutenu sa thèse début 2000 en Informatique dans le domaine des hypermédias adaptatifs dynamiques. Depuis ses activités de recherche sont doubles. Il travaille toujours sur les hypermédias adaptatifs, plus particulièrement sur le modèle de l'apprenant. Mais il travaille aussi, depuis 2002, sur la création de schémas de métadonnées pédagogiques.

Adresse : INSA de Rouen, Laboratoire PSI, BP08 Avenue de l'Université, 76801 Saint Etienne du Rouvray Cedex

Courriel : Nicolas.Delestre@insa-rouen.fr

Toile : http://asi.insa-rouen.fr/~delestre