Apprentissage ubiquitaire et coopération scientifique via des grilles sémantiques

L'apprentissage ubiquitaire ("u-learning") réfère à un apprentissage électronique fourni à n'importe quel momment ou place opportune (par exemple via un portable lorsque "l'étudiant" passe près d'un monument historique appartenant à une période à laquelle il est intéréssé) et plus généralement à la possibilité de prendre en compte automatiquement divers contextes d'apprentissage. Ceci dépasse donc l'accés à des ressources d'apprentissage statiques (par exemple des documents au format PDF) et inclus 1) la prise en compte d'une approche pédagogique particulière ou des préférences de l'étudiant, 2) la compréhension de concepts à travers des experiences directes de leurs manifestations (et donc l'accés à des données réelles et à des interfaces sophistiquées), 3) l'apprentissage via l'accés à des pairs (étudiants / collègues) ou des tuteurs (enseignants ou experts), et 4) la participation de l'étudiant à la création des ressources d'apprentissage.

Les nécessités économiques, pédagogiques et techniques de prendre en compte ces divers aspects et l'intérêt des grilles sémantiques ("semantic grids") pour supporter ces aspects a été reconnu par de nombreux chercheurs - e.g., Allison & al. (2005) et Gouardères & al. (2005) - dont plusieurs participent à ELeGI ("European Learning Grid Infrastructure"; www.elegi.org), un projet européen qui a débuté en octobre 2004. Les grilles sémantiques marrient les techniques des grilles informatiques (qui permettent l'exploitation partagée des machines des participants du réseau que forme une certaine "grille", offrent une architecture logicielle commune et supportent donc le développement de services communs et, comme les réseaux pairs à pairs, facilitent divers services de partage de données et de collaboration) et des techniques du Semantic Web - ou plus généralement de la représentation et du partage de connaissances - qui facilitent la recherche et la combinaison des données et des services. Il s'agit toutefois d'un marriage récent (De Roure & al., 2003) et aussi bien les techniques des grilles informatiques que celles de la représentation et du partage de connaissances sont loin d'être matures. Les recherches sur ce sujet sont donc variées; voici quelques exemples: 1) l'exploitation par Allison & al, (2005) de la plateforme OGSA ("Open Grid Services Architecture") pour étendre et appliquer les spécifications de standards tels que l'IMS-LD pour la ré-utilisation et l'intéropérabilité des objets d'apprentissages, et donc plus généralement pour spécifier et prendre en compte le contexte de chaque étudiant (e.g., identité, préférences, niveaux dans divers domaines, caractéristiques des interfaces et outils de communication possédés par l'étudiant), 2) la création de la plateform S-OGSA ("Semantic-OGSA") par le projet OntoGrid (un projet européen réunissant huit partenaires qui a débuté en octobre 2004) pour faciliter la représentation et le partage de connaissances, 3) le projet CoAKTinG ("Collaborative Advanced Knowledge Technologies in the Grid") qui facilite l'avènement de meetings sur la grille et la collaboration ou l'échange de données durant et après ces meetings, et 4) GRID-e-CARD (Gouardères & al., 2005) un projet qui gère un modèle de qualifications pour chaque objet d'apprentissage et chaque étudiant d'une grille afin de faciliter l'apprentissage de chaque étudiant (notamment par son insertion dans des communautés d'apprentissage adéquates).

Toutefois, dans toutes les recherches sur les grilles sémantiques, et aussi dans les recherches sur les objets d'apprentissages, la représentation et le partage des connaissances est en réalité beaucoup plus superficielle qu'une lecture superficielle des descriptions de ces recherches pourraient laisser croire. Par exemple, les objets d'apprentisage (OA) existant actuellement ne portent que très exceptionellement sur une seule relation (i.e., de nos jours un OA ne décrit pas une relation entre un objet et un autre autre objet, par exemple entre la fonction "cosinus" et une definition ou bien un théoreme utilisant cette fonction, ou entre le language "Java" et une de ses charactéristiques) mais sur un ensemble de relations (par exemple, un OA typique à propos de Java est une "introduction à Java" contenant une description des charactériques principales de Java et un exemple de code). Ceci va à l'encontre du but théorique des OAs qui est d'obtenir un découpage aussi fin que possible de la connaissance pour permettre des choix et réutilisations/combinaisons optimales de ces objets. De plus, les méta-données actuellement associables à ces objets sont pauvres et informelles; typiquement: le nom de l'auteur, une description informelle, quelques mot clés, et une liste de formats de présentation (e.g., Flash, PDF, HTML); ceci ne permet pas guère une recherche sémantique des OAs (et donc une recherche éfficace car il y peut y avoir des milliers d'OAs sur Java par exemple) et encore moins la comparaison de ces OAs (il faut aussi noter que plus les OAs portent sur un grand nombre d'objets, plus leur comparaison est difficile; comparer deux concepts ou deux idées est possible car l'un(e) peut par exemple être une specialisation, un argument ou une sous-tâche de l'autre mais il est très rare que deux articles ou deux documentations puissent être reliées par de telles relations).
De même, les modélisations des préférences et connaissances des étudiants sont souvent très pauvres; par exemple: un mot-clé pour un OA (e.g., "Java") et un type de niveau (e.g., "connaissances de base"). Ceci ne permet pas vraiment de savoir ce que l'étudiant connait, contrairement à une approche plus fine où sont stoqués toutes les relations pour lesquelles l'étudiant a réussi des tests associés à leur compréhension).
De même, le fait que les connaissances ne soient pas modélisées de manière plus fine et plus formelle limite les possibilités de participation de chaque utulisateur d'une grille (étudiant, pédagogue, expert, chercheur, employé, directeur, etc.) de participer à l'élaboration des connaissances (OAs inclus).

Ce projet est basé sur la reconnaissance du fait qu'une base de connaissances (générale ou specialisée mais, dans tous les cas, détaillée et formelle) est l'outil idéal pour la recherche, la comparaison, l'exploitation et la ré-utilisation des connaissances, que celles-ci soit destinées à l'apprentissage, à la prise de décision, à la recherche, comparaison ou évaluation de techniques (par exemple, à la recherche et à l'évaluation de l'originalité des résultats de travaux de recherches), à la collaboration ou à la prise de décisions. Bien que de telles base de connaissances (BCs) soient très difficile à créer manuellement (et encore plus automatiquement), il existe quelques projets à (très) long terme dont l'ambition est de créer de telles bases, par exemple le projet QED dont le but est de créer une BC de tous les faits mathématiques reconnus et importants, le projet OpenGalen dont le but est d'établir une ontologie de la médecine (mais toutefois pas de toutes les connaissances en médecine), et enfin le "Digital Aristotle" dont le but ultime est de représenter, enseigner, et utiliser pour la résolution de problèmes classiques, toutes les connaissances scientifiques acceptées. Le but du projet ici proposé n'est pas de créer de telles bases mais de permettre et d'encourager la création de connaissances aussi précises et structurées que possible par les "utilisateurs" de grilles sémantiques, et donc aussi l'exploitation de ces connaissances. Le terme "utilisateurs" est désormais utilisé pour désigner tous les fournisseurs et consommateurs de connaissances (étudiants, pédagogues ou experts; participants d'une ou plusieurs grilles). L'expression "aussi précises et structurées que possible" reconnaît que l'entrée de connaissances "semi-formelles" doit être acceptée pour que cette méthode soit suffisament rapide acceptée par les utilisateurs (ainsi, les termes utilisés pour les concepts et les relations n'ont pas tous à être formels, i.e., déclarés) mais 1) toute phrase (formelle ou non) et tout terme formel doit être relié à au moins une autre phrase ou un autre terme par une relation formelle (comme indiqué dans le paragraphe précédent, nous considérons que cette structure de réseau sémantique est une structure minimale pour permettre la comparaison et la réutilisation de connaissances), 2) une ontologie lexicale incluant au moins tous les concepts communs (et les liant à tous les mots communs) doit être proposée (une telle ontologie proposée par Martin (2003b) peut être réutilisée pour cela mais de nombreuses extensions et corrections restent à faire pour que cette ontologie offre un support suffisant pour la représentation et la réutilisation de connaissances), 3) cette ontologie doit pouvoir être partagée et modifiable par tous les utilisateurs (nous considérons qu'un ensemble d'ontologies partiellement redondantes ou inconsistentes ne permet pas une comparaison et réutilisation suffisante des connaissances car il est très difficile pour une personne - et a fortiori pour un logiciel - d'interconnecter de manière correcte et précise des ontologies développées indépendamment l'une de l'autre et sans le guide d'une grande ontologie).

Ce dernier point n'implique pas que les utilisateurs doivent s'accorder entre eux pour éviter les conflits lexicaux et sémantiques. les conflits lexicaux sont aisément évités en préfixant chaque terme formel par l'identificateur de son créateur, et les conflits sémantiques sont évités par les protocoles proposés par (Martin, 2003) qui imposent aux utilisateurs d'expliciter certaines relations entres des phrases (formelles ou non) contradictoires ou partiellement redondantes, mais permettent aux utilisateurs d'avoir des "croyances" différentes. Des exemples de telles relations sont: "corrective_specialisation", "corrective_generalisation", "correction" et "example". Le choix entres des croyances contradictoires n'a pas à être fait (nécéssairement arbitrairement) dans la BC, mais il peut être fait plus tard dans le cadre d'une utilisation précise et compte-tenu des relations qui ont été posées entre les croyances contradictoires ou redondantes (par exemple, une stratégie aisément automatisable est toujours sélectioner les croyances les plus specialisées, c'est à dire les plus précises). Les croyances provenant de certains utilisateurs (e.g., les utilisateurs abonnés à certains types de journaux, en supposant que cette information soit stoquée) peuvent être automatiquement sélectionées (ou non) pour certaines exploitations. Enfin, Martin & al. (2005) proposent une méthode pour évaluer l'originalité et la popularité de certaines croyances, puis de leurs créateurs. Cette méthode est basée sur les relations d'argumention existant entre phrases (idées, croyances) et sur des votes par les utilisateurs sur l'originalité et la popularité de ces phrases. Cette méthode peut être personalisée par chaque utilisateur et constitue donc un moyen potentiellement efficace de filtrer la BC pour ne voir que les parties qu'un utilisateur souhaite voir ou utiliser. Comme cette méthode attribue un score à chaque phrase et à chaque utilisateur, elle constitue aussi un moyen d'encourager l'entrée d'idées précises et originales par les utilisateurs. Les idées ci-dessus ont été implémentées par Martin (2003) et Martin & al. (2005) dans un serveur de connaissances (pour des raisons de facilité). Toutefois, rien ne semble empécher l'implémentation et l'extension de ces idées dans un système pair-à-pair ou donc dans une grille sémantique (un système de réplication de connaissances entre serveurs pairs est d'ailleurs proposé par Martin & al. (2005)). Ce sera donc un des axes de ce projet et l'architecture S-OGSA sera exploitée pour cela.

Les deux autres axes de ce projet seront 1) d'encourager l'adoption de cette approche par la production d'OAs répondants aux critères ci-dessus, et 2) créer des applications exploitant la BC d'une grille sémantique et le résultats d'autres recherches liées au grille sémantiques pour créer des applications permettant un "apprentissage ubiquitaire" (comme indiqué ci-dessus, la BC peut être répartie et/ou répliquée dans les diverses machines de la grille). Quoique le terme "apprentissage" est utilisé, comme indiqué ci-dessus, l'approche de ce projet est en réalité destiné à favoriser toute recherche, comparison, échange et complémentation de connaissances. D'où le titre du projet.

Références

Allison C., Cerri S.A., Ritrovato P. & Gaeta M. (2005). Services, Semantics and Standards: Elements of a Learning Grid Infrastructure. Applied Artificial Intelligence Journal (Vol. 19, No. 9-10, pp. 861-879), Dec. 2005.

De Roure D., Jennings N. & Shadbolt N. (2003). The Semantic Grid: A future e-Science infrastructure Grid Computing - Making the Global Infrastructure a Reality (Chichester, UK: John Wiley and Sons Ltd., pp. 437-470).

Gouardères G., Saber M., Nkambou R. & Yatchou R. (2005). The Grid-E-Card: Architecture to Share Collective Intelligence on the Grid. Applied Artificial Intelligence (Vol. 19, No. 9-10, pp. 1043-1073), Dec. 2005.

Martin Ph., Eboueya M., Jo J. & Uden L. (2006). Between too informal and too formal. Proceedings of KMO 2006, International Conference on Knowledge Management in Organizations (UM FERI; editors: M. Hericko, A. ZivKovic; pp. 38-87; ISBN 86-435-07809-6), Maribor, Slovenia, June 13-14, 2006.

Martin Ph., Blumenstein M. & Deer P. (2005). Toward cooperatively-built knowledge repositories. Proceedings of ICCS 2005, 13th International Conference on Conceptual Structures (Springer, LNAI 3596, pp. 411-424), Kassel, Germany, July 18-22, 2005.

Martin Ph. (2003b). Correction and Extension of WordNet 1.7. Proceedings of ICCS 2003, 11th International Conference on Conceptual Structures (Springer, LNAI 2746, pp. 160-173), Dresden, Germany, July 21-25, 2003.

Martin Ph. (2003). Knowledge Representation, Sharing and Retrieval on the Web. Chapter 12 of a book titled "Web Intelligence" (Springer; editors: N. Zhong, J. Liu, Y. Yao; pp. 263-297; ISBN 3-540-44384-3; Web Intelligence Consortium's book), January 2003.