un tat de l`art. - Sophia Antipolis
Transcription
un tat de l`art. - Sophia Antipolis
Rapprocher les ontologies et les folksonomies pour la gestion des connaissances partages : un tat de l’art. Freddy Limpens1 , Fabien Gandon1 , Michel Buffa2 1 Edelweiss, INRIA Sophia-Antipolis, France, 2004 route des lucioles - BP 93, FR-06902 Sophia-Antipolis Cedex {freddy.limpens, fabien.gandon}@sophia.inria.fr 2 KEWI, Laboratoire I3S, Universit de Nice, France [email protected] Résumé : Ces dernires annes, le “tagging social” s’est impos au sein du Web 2.0 comme le principal moyen de classification de donnes en trs grand nombre. Nanmoins, l’emploi pour la classification d’ensembles de tags non contrls, appels folksonomies, pose plusieurs problmes : le problme de l’ambigut (un tag dnotant plusieurs concepts), le problme de variations d’critures (plusieurs tags dnotant un mme concept) et le manque d’assistance l’exploitation de ces structures (notamment pour la recherche ou l’change d’informations) en l’absence de reprsentations explicites de ces connaissances partages. Cet article prsente un tat de l’art comparatif et une discussion sur les travaux proposant une volution de ces systmes base de folksonomies, en tenant compte, notamment, des travaux existant dans le domaine de la reprsentation des connaissances, en particulier ceux base d’ontologies. Mots-clés : Web social, Folksonomies, Ontologies, Partage de connaissances 1 Introduction La classification et le partage des ressources au sein du Web posent plusieurs problmes auxquels prtendent rpondre les systmes de reprsentation base d’ontologies ainsi que ceux reposant sur des folksonomies. Le terme folksonomie est un mot valise d’origine anglaise introduit par Vanderwal (2004) et exprimant l’ide d’une classification (“taxonomy”) faite par les usagers (“folks”). Les ontologies sont des structures de reprsentation d’un champ de connaissance et visent “spcifier explicitement une conceptualisation” (Gruber, 1993). Plus particulirement, les ontologies formelles sont des spcifications de la conceptualisation d’un champ de connaissances l’aide de smantiques formelles, et sont exploitables par des programmes informatiques afin d’assister le partage de ces connaissances travers diffrentes applications. Leur conception relve souvent d’un processus engageant des ontologues, assists d’experts du domaine modliser. L’obstacle IC 2008 majeur la gnralisation de l’emploi d’ontologies formelles au sein du Web est le cot de leur laboration, de leur maintenance, et de leur exploitation pour l’annotation des ressources. Le partage de ressources tagues sur le Web 2.0 s’appelle le “tagging social” et produit des folksonomies. Les folksonomies sont des organisations de ressources issues des usages et leur obtention est non supervise. Ces folksonomies ouvrent de nombreuses possibilits d’exploitation, pourvu qu’un systme de partage efficace des connaissances et des ressources en tire profit. Dans cette perspective se dressent cependant certains obstacles l’emploi des folksonomies comme reprsentation des connaissances (Mathes, 2004; Passant, 2007) : (1) l’ambigut des tags, car un tag peut dsigner plusieurs concepts ; (2) les variations des critures des tags pour dsigner un mme concept ; (3) et le manque d’assistance l’exploitation de ces structures (notamment pour la recherche ou l’change d’informations) en l’absence de reprsentations explicites ou formelles de ces connaissances partages. Un certain nombre de travaux se sont penchs sur ce problme de l’annotation des documents et du partage des connaissances. Les systmes qu’ils proposent tentent de rconcilier les modles de reprsentations des connaissances base d’ontologies et ceux base de folksonomies. Dans une premire section nous prsentons les approches visant extraire des liens smantiques entre les termes des folksonomies. Dans une deuxime section, les contributions prsentes s’attachent soutenir les folksonomies l’aide d’ontologies. Enfin nous abordons les travaux visant exploiter les formalismes du Web smantique pour l’change de ressources. 2 mergences de structures dans les folksonomies Les contributions prsentes dans cette partie analysent a posteriori la structure des folksonomies pour obtenir une reprsentation de la structure smantique induite par les communauts, comme premire tape suppose l’laboration d’ontologies. 2.1 Analyse des rseaux sociaux appliques aux folksonomies Mika (2005) propose de considrer les folksonomies comme des structures smantiques mergentes des usages de la communaut. Son objectif est de construire des “ontologies lgres” (lightweight ontologies) partir de l’analyse de folksonomies. Mika propose un modle “tripartite” des folksonomies o les instances sont des ressources Web associes par un acteur une liste de concepts (les tags). Des mthodes d’analyse de rseaux sociaux sont ensuite utilises pour tisser des rseaux refltant les liens entre les concepts et en dduire des regroupements de termes, ou des relations de subsumption (relation “isa”). Mika (2005) rapproche les concepts via deux perspectives en tissant (1) le rseau liant les instances (ressources) aux concepts (tags) les caractrisant, et en rapprochant les concepts (tags) ayant le plus d’instances en commun (2) le rseau liant les concepts aux acteurs les utilisant et en rapprochant les concepts ayant le plus d’acteurs en commun. Le premier rseau donne un graphe concepts-instances refltant la co-occurrence des tags sur les mmes ressources. Le deuxime donne un graphe concepts-acteurs refltant les recoupements entre communauts d’intrt. Dans ce dernier cas, une communaut Rapprocher Ontologies et Folksonomies d’intrt pourrait tre reprsente par l’ensemble des acteurs ayant utilis le tag “longitude”. Si les communauts “longitude” et “latitude” ont un certain nombre d’acteurs en commun, les tags “longitude” et “latitude” seront considrs comme smantiquement proches. Le graphe concepts-acteurs reflte de manire plus prcise la spcificit du vocabulaire utilis par la communaut considre, car le rapprochement de deux termes ne peut se faire que s’ils ont un grand nombre d’utilisateurs en commun. Il permet de surcrot de dduire des relations du type “plus gnral / plus prcis” entre les termes. En effet si l’ensemble correspondant la communaut “pche sous-marine” est un sous-ensemble de la communaut lie au tag “activits nautiques”, alors le tag “activits nautiques” est considr comme plus gnral que le tag “pche sous-marine”. 2.2 Analyse de la dynamique des folksonomies Halpin et al. (2007) analysent la dynamique des folksonomies et recherchent les lois de distribution de la frquence d’utilisation des tags. La question qu’ils posent est celle de la cohrence des folksonomies et, plus prcisment, celle de la stabilit de la distribution des tags pour une ressource donne au cours du temps. Leur hypothse est que les tags les plus utiliss pour annoter une ressource demeurent les mmes, et que la distribution de leur frquence d’apparition suit une loi de puissance. Ils vrifient cette hypothse pour les sept dix tags les plus utiliss pour caractriser des sites populaires sur un service de bookmarking social 1 . L’analyse montre que la distribution des tags pour les sites les plus populaires devient stable partir d’un temps quasiment constant. Par ailleurs, les auteurs se sont intresss la recherche de liens smantiques entre les termes de ce vocabulaire l’aide de graphes de corrlations inter-tags. Chaque noeud de ces graphes reprsente un tag sous forme d’un cercle dont le diamtre est pondr par la frquence d’apparition de ce tag. La longueur des arcs reliant les tags co-occurrents est pondre par leur degr de co-occurrence. Cette visualisation est un point de dpart possible pour l’laboration d’ontologies plus structures. 2.3 Cluster en correspondance avec des ontologies Specia & Motta (2007) effectuent un traitement statistique des annotations en regroupant les tags fortement lis entre eux pour former des clusters. La mthode choisie consiste construire la matrice de co-occurrence des tags sur les mmes ressources, puis calculer la distance angulaire entre chaque ligne de cette matrice. Cette distance est exploite pour constituer des clusters de tags. La deuxime tape consiste expliciter les liens pouvant exister entre les tags d’un mme cluster. Pour ce faire, le systme recherche dans des ontologies du Web smantique la prsence de toutes les paires de tags de chaque cluster. En cas de succs, le systme recherche les relations possibles existant entre les tags de chaque paire. Une tentative d’automatisation plus complte de cette mthode a par ailleurs t mene par Angeletou et al. (2007). 1. http ://del.icio.us IC 2008 2.4 Fouille de donne et folksonomies D’autres approches reprennent le modle tripartite des folksonomies de Mika (Mika, 2005) et appliquent des mthodes de fouille de donnes afin d’extraire des informations sur la structure des folksonomies. Jäschke et al. (2008) exploitent les mthodes d’analyse formelle de concepts afin de dcouvrir les sous ensembles d’utilisateurs de folksonomies partageant la mme conceptualisation sur les mmes ressources. Pour ce faire ils construisent des triples (Ressources, Utilisateurs, Tags) appels tri-concepts o chaque utilisateur a tagu chaque ressource avec tous les tags. L’extraction des tri-concepts d’une folksonomie constitue, selon les auteurs, une premire tape la construction d’ontologies. Les ontologies sont ainsi vues comme des constructions sociales o un concept est dcrit par un ensemble de tags appartenant un ensemble d’utilisateurs et utiliss pour caractriser un certain type de ressources. D’autres techniques de fouille de donnes ont t appliques par Schmitz et al. (2006) afin d’extraire des rgles d’association au sein des folksonomies. La premire tape est de projeter le modle tripartite (Ressources, Utilisateurs, Tags) sur une structure deux dimensions, par exemple en considrant l’ensemble des couples (Utilisateurs, Ressources) associs un ensemble de tags Tx . A partir de cette projection, un exemple de rgle d’association qu’il est possible d’extraire est le suivant : les Utilisateurs associant les tags de l’ensemble TA un ensemble de Ressources, associent souvent les tags de l’ensemble TB ces mmes ressources. Ce type de rgles pourrait tre notamment appliqu dans un systme de recommandation de tags. 2.5 Structuration manuelle de folksonomies Tanasescu & Streibel (2007) proposent pour structurer les folksonomies de rexploiter les ressorts ayant fait le succs des applications du Web 2.0. Ils suggrent d’tendre les systmes actuels de tagging social en permettant tous les utilisateurs de taguer les tags eux mmes ou les relations pouvant exister entre certains tags. Ces relations peuvent naturellement tre exprimes l’aide de triples, ce qui permet d’intgrer facilement ces connaissances dans un moteur de recherche du Web smantique. Les auteurs soulvent le problme de la pertinence des informations fournies par les utilisateurs qu’un systme non centralis ne peut garantir. Afin d’y remdier, la rgulation d’un tel systme serait assure par la communaut (cf. WikiPedia), et outille par la possibilit d’apprcier ou de dprcier un tag, ou encore par des systmes de “points” gagns en fonctions de la participation en tant qu’auteur ou mme navigateur. Ces procds visant inciter les contributions sont propres aux plateformes sociales et pourraient par ailleurs tre tendus avec les “jeux srieux”. Les “jeux srieux” sont des activits prsents sous un jour ludique, mais exploites des fins de traitement de donnes complexes ncessitant de l’intelligence humaine moindre cot. Un exemple de ce type de jeux est “The ESP Game” 2 o deux joueurs connects simultanment doivent se mettre d’accord sur le label (tag) attribuer une image qu’ils ont sous les yeux. Les multiples annotations d’images ainsi fournies par les joueurs sont ensuite capitalises et mises disposition pour la recherche d’informations, ou la description d’images aux non-voyants. 2. http ://www.espgame.org Rapprocher Ontologies et Folksonomies 2.6 Conclusion partielle Les rsultats des approches visant extraire la structure smantique des folksonomies sont encourageants. Mika (2005) montre qu’il est possible d’extraire d’une folksonomie les termes les plus reprsentatifs d’une communaut ainsi que certaines relations smantiques entre ces termes. Halpin et al. (2007) montrent de leur ct que les folksonomies lies aux sites les plus populaires prsentent des distributions stables et peuvent aussi servir de base la construction d’ontologies. Les mthodes de fouille de donnes proposes par Schmitz et al. (2006) et Jäschke et al. (2008) apportent des perspectives sur les folksonomies en vue d’une explicitation plus avance. Cependant les structures extraites automatiquement souffrent encore de l’ambigut des liens tablis entre les concepts. Si nous prenons l’exemple des concepts “vhicules, avions, pilotes”, il serait possible, partir des mthodes proposes par Mika, d’infrer un lien entre ces trois termes, puis un lien de subsumption entre “avions” et “vhicules”. Mais le lien entre “avions” et “pilotes” n’est pas un lien de subsumption, et le typage de ce lien requiert une expertise du domaine concern. Reposant sur le dynamisme du Web social, Tanasescu & Streibel (2007) suggrent quant eux d’impliquer les utilisateurs dans la qualification des liens entre tags, tandis que Specia & Motta (2007) entreprennent cette tche en interrogeant les ontologies du Web smantique. 3 Ontologies comme support des folksonomies Dans cette partie nous abordons les travaux proposant d’apporter un support formel aux folksonomies, soit en faisant des tags les attributs des concepts d’une ontologie formelle (Passant, 2007; Good et al., 2007) soit en rifiant les tags eux mmes et en crant une “ontologie de folksonomie” (Gruber, 2005; Buffa et al., 2008; Newman et al., 2005; Kim et al., 2007). 3.1 Guider le tagging l’aide d’ontologies De nombreuses solutions visant intgrer le plus naturellement possible interface de tagging et systmes base d’ontologies ont rcemment vu le jour. Passant (2007) propose de structurer une folksonomie pendant l’annotation des billets d’un blog d’entreprise par l’intermdiaire d’un systme centralis ; ici un tag est une proprit (hasTag) d’un concept d’une ontologie contrle. L’ontologie subordonne l’annotation en aiguillant le choix du tag : il s’agit en fait pour l’utilisateur de rutiliser un label existant, ou de proposer un nouveau label pour un concept qui existe dj. Cependant l’utilisateur reste libre de soumettre l’administrateur un concept et son label (tag) s’il n’existe pas encore. L’intrt vient de ce que l’ambigut des tags par rapport aux concepts qu’ils sont censs dsigner est automatiquement leve : si l’utilisateur propose un tag qui peut tre reli deux concepts diffrents (par exemple “EDF” pour “lectricit De France” ou pour “quipe De France”), le systme propose de choisir parmi les diffrentes possibilits. Le billet annot par son auteur sera lui aussi reli au concept slectionn afin de lever l’ambigut des tags au moment de la consultation du blog, en permettant de ne rcuprer que les billets lis au concept voulu et non ceux lis tous les concepts associs un tag donn. Suivant une dmarche similaire, IC 2008 Good et al. (2007) proposent un accs des terminologies professionnelles aux utilisateurs d’un service de bookmarking social, Connotea 3 . Ainsi les utilisateurs ajoutant des tags une ressource peuvent choisir parmi une suggestion, faite par le systme, de termes extraits d’ontologies. Le systme faisant coexister des termes librement choisis et des termes issus de terminologies contrles, les auteurs suggrent d’exploiter l’ensemble de ces annotations pour en dduire des relations existantes entre ces deux types de termes. Dans une perspective de gnralisation, il semble que ce type de mthode ncessitent de connaitre a priori le domaine de connaissances concern afin de guider la slection des ontologies interroger pour suggrer des termes. 3.2 Construire une ontologie de folksonomie Dans son article, Gruber (2005) pose qu’il n’y a pas d’opposition entre les ontologies et les folksonomies et propose de construire une “ontologie de folksonomie”. La “TagOntology” est un projet de construction d’une ontologie commune ddie la formalisation et la conceptualisation de l’acte d’annoter une ressource par un terme (tagging). Ce modle met en œuvre quatre entits pour caractriser un vnement de “tagging” : l’objet tagu, ou la ressource ; le tag, c’est dire le mot-cl utilis ; l’utilisateur taguant ; et le domaine au sein duquel le tagging s’inscrit (ce peut tre le service utilis par exemple). A la diffrence de Passant (2007), pour qui le tag est une simple chane de caractres relie des concepts d’ontologies formelles, Gruber va plus loin dans la rification des tags et considre chaque tag comme un objet part entire. Pour contrer les ambiguts des tags ou les usages abusifs (spam), Gruber proposait dj de “tagger les tags”. Par ce biais, il serait possible d’indiquer que tel tag est synonyme de tel autre tag, ou encore que tel tag est adquat ou non pour tel objet. Kim et al. (2007) proposent quant eux l’ontologie SCOT 4 pour reprsenter les nuages de tags afin de faciliter leur partage (section 4.2). Buffa et al. (2008) ont de leur ct appliqu l’ide d’exprimer les tags directement l’aide des langages du Web smantique. Les tags sont donc collects comme autant de nouvelles classes d’ontologie et servent annoter les pages d’un wiki “smantique” (section 4.3). 3.3 Conclusion partielle Dans cette partie nous avons montr que les approches base d’ontologies peuvent tre appliques aux folksonomies, apportant une richesse supplmentaire illustre par des exemples concrets d’implmentation. Passant (2007) fait de chaque tag une proprit rattache des concepts dans l’ontologie d’une entreprise. Cette approche permet, au cours de l’utilisation, de lever l’ambigut des tags, mais galement d’enrichir l’ontologie lorsqu’un nouveau tag ne correspond aucun concept existant. Gruber (2005) a introduit l’ide d’une “ontologie de folksonomie”, o chaque vnement de tagging a des attributs lis (tag, objet dsign par le tag, tagueur, ressource concerne, etc.). 3. Connotea : http ://www.connotea.org/ 4. http ://scot-project.org/scot/ns Rapprocher Ontologies et Folksonomies 4 Ontologies et folksonomies sur le Web Les pratiques du Web 2.0 et les technologies du Web smantique s’intressent toutes les deux, mais de faons diffrentes, la notion d’un partage social du sens, et ces dernires annes ont montr la complmentarit de ces approches (Greaves & Mika, 2008). Les approches de cette section proposent d’exploiter les formalismes du Web smantique en vue de favoriser l’interconnexion des sites Web usages communautaires. Ici pas d’ontologie de domaine, mais des annotations reposant sur des ontologies formelles visant relier efficacement les ressources entre elles. Ces approches peuvent constituer une position intermdiaire qui peut rester indpendante ou non d’un couplage avec des ontologies de domaine. 4.1 Communauts en ligne interconnectes Le projet SIOC (Breslin et al., 2005) offre un cadre formel et technologique pour dcrire les ressources changes sur les blogs et forums de discussions, et plus gnralement sur toute plateforme sociale d’changes en ligne. L’ontologie propose utilise d’autres ontologies du Web smantique, comme SKOS 5 , dcrivant les systmes d’organisation simple de la connaissance, et FOAF 6 (Brickley & Miller, 2004) pour dcrire les identits et les accointances d’un utilisateur. SIOC 7 dcrit les lments prsents dans la plupart des sites communautaires : la notion de “site”, comme emplacement de la communaut ; la notion de “post”, ou billet pour un blog ; la notion de “forum” ; la notion “d’utilisateur” ; etc. A partir de ce vocabulaire Breslin et al. (2005) proposent des extensions pour extraire ces annotations de plateformes courantes (ex : Wordpress 8 ). 4.2 Ressources sur le Web De nombreux autres travaux ont cherch intgrer plusieurs ontologies dans le but de structurer les donnes en vue de leur partage. Hausenblas & Rehatschek (2007) proposent avec “mle” un systme permettant le traitement automatique des listes de diffusion par emails, dans le but de constituer une base de connaissances conforme aux standards du Web smantique. Cette approche utilise SIOC pour reprsenter les champs des emails (objet, metteurs, rcepteurs, etc.). Ces annotations exprimes en RDF peuvent ensuite tre mises disposition d’un service Web, pour pouvoir tre interroges grce au langage de requte du Web Smantique SPARQL 9 . Le projet Revyu 10 (Heath & Motta, 2007) propose de mettre en pratique les principes du “Web of Data” (Web de Donnes) pour organiser le partage de revues de contenus culturels (livres, films de cinma, etc.). Parmis les principes du “Web de Donnes” prco5. 6. 7. 8. 9. 10. SKOS : Simple Knowledge Organisation System, http ://www.w3.org/2004/02/skos/ FOAF : Friend Of A Friend, http ://www.foaf-project.org/ SIOC Ontology http ://www.w3.org/Submission/2007/SUBM-sioc-applications-20070612/ Logiciel de blog Wordpress, http ://wordpress.org/ SPARQL Query Language for RDF : http ://www.w3.org/TR/rdf-sparql-query/ http ://revyu.com/ IC 2008 niss par Tim-Berners Lee 11 nous pouvons citer : l’utilisation d’URIs comme noms et sous forme de lien HTTP pour faciliter l’accessibilit un maximum d’information sur chaque item index et l’interconnexion avec d’autres URIs. Les formalismes du Web Smantique permettent de raliser ces principes 12 , et Revyu les implmente pleinement : (1) en permettant d’accder des donnes stockes sur d’autres dpts afin d’viter la redondance d’informations ; (2) en utilisant RDF pour l’annotation ; et (3) en ne restreignant pas le domaine couvert, puisque Revyu n’impose pas un ensemble dfini d’ontologies, mais utilise des sources externes pour catgoriser les items. D’autres approches visant structurer smantiquement des contributions annotes l’aide de tags ont rcemment t proposes, comme GroupMe ! 13 (Abel et al., 2007) ou inter.est 14 (Kim et al., 2007) et consistent enrichir les services de bookmarking social (tel que del.icio.us) l’aide des technologies du Web smantique. L’objectif de intere.st est d’intgrer les apports du Web smantique un service de bookmarking social, et l’ontologie SCOT 15 en est le support. Cette ontologie permet de dcrire les termes d’un nuage de tags (ensembles de tags relis des ressources et appartenant des utilisateurs) dans le but d’instrumenter son partage. Le service propos vise agrger des nuages de tags, former des groupes d’change et faciliter la recherche de nuages de tags similaires, refltant ainsi les communauts d’intrt en germe. 4.3 Wikis smantiques Les wikis “smantiques” ont t parmis les pionniers dans l’utilisation d’ontologies formelles en “soutien” aux folksonomies. SweetWiki (Buffa et al., 2008) en est un exemple : les utilisateurs peuvent diter et modifier des pages, mais aussi taguer des pages, des images, des vidos, etc. Les tags sont relis entre eux au sein d’une folksonomie reprsente l’aide des langages du Web smantique. Les nouveaux tags sont collects comme labels (termes) de nouvelles classes qui sont subsumes par dfaut par la classe “nouveaux concepts”. Ensuite, et selon les principes de contribution et de rgulation collective observ au sein du Web 2.0, des utilisateurs peuvent organiser les tags de la folksonomie, les diter, ajouter des labels dans d’autres langues, crer des relations de synonymie, fusionner des classes, etc. Les auteurs de pages peuvent utiliser galement les tags pour proposer des fonctionnalits de “veille” : chaque utilisateur peut dans sa page personnelle spcifier une liste de tags correspondant aux sujets qui l’intressent. Par exemple, un utilisateur intress par les “wikis”, entrera le tag “wiki” dans sa page personnelle : sa page contiendra dsormais une liste de liens vers des pages tagues avec “wiki” ou avec une sous-classe de ce mot-cl dans la folksonomie organise. Cette approche permet de surveiller des ressources qui n’existent pas encore : si aucune page ne parle de “wiki”, lorsqu’une page avec ce tag ou un de ses sous-tag est cre, l’utilisateur est notifi. En gardant trace des pages cres et modifies, des documents tagus et surveills, et en analysant le comportement des utili11. 12. 13. 14. 15. La Recherche (nov 2007) : “L’avenir d’Internet. Tim Berners-Lee : Le Web va changer de dimension” pour plus de dtails voir galement : http ://linkeddata.org/ http ://groupme.org/ http ://int.ere.st/ http ://scot-project.org/scot/ns Rapprocher Ontologies et Folksonomies sateurs au cours du temps, il est possible de dtecter des rseaux d’accointances ou des communauts d’intrts. Les possibilits alors offertes sont multiples : trouver la personne la plus active sur un sujet donn, trouver des utilisateurs utilisant le plus de tags quivalents, infrer des relations entre les tags lorsqu’ils partagent des utilisateurs communs, des ressources communes, etc. 4.4 Conclusion partielle Nous avons ainsi vu l’apport des formalismes du Web smantique aux services de partages de connaissance fonds sur des contributions de revues (Revyu), ou de bookmark (intere.st, GroupMe !) ou encore de pages de wiki (SweetWiki). GroupMe ! et intere.st mettent cependant l’accent sur les changes sociaux qui accompagnent l’utilisation de ces services, tandis que Revyu se concentre sur l’application des principes du Web de donnes en favorisant l’interconnexion des ressources. Les wikis smantiques ont permis quant eux de montrer l’intrt des ontologies comme support d’une connaissance “en construction”. Buffa et al. (2008) proposent ainsi de factoriser la rorganisation des tagsconcepts, en permettant chaque utilisateur de modifier la folksonomie et de fusionner certains tags-concepts, de proposer des synonymes, etc. Ces travaux montrent galement les possibilits apportes par le format RDF, en implmentant des solutions de partage des connaissances reposant sur des structures ontologiques. 5 Discussion Dans cet article nous avons compar diffrentes approches visant rapprocher ontologies et folksonomies pour l’indexation des ressources partages. Ces approches, souvent complmentaires, peuvent tre considres selon diffrents axes. Premirement, selon un axe structuration/formalisation suivant lequel : (a) soit on cherche analyser les tags et infrer des relations smantiques entre les lments de folksonomies en vue de leur structuration (section 2) ; (b) soit on cherche guider l’indexation des interactions et des contributions aux folksonomies grce une formalisation base d’ontologies (sections 3 et 4). Deuximement, on pourra chercher distinguer les types de ressources annotes et la stratgie adopte. Abel et al. (2007) et Kim et al. (2007) cherchent assister le partage de bookmarks avec des ontologies (notamment SKOS, SIOC, et FOAF) visant assister l’interconnexion des ressources et des personnes au sein des communauts en lignes. Ce mme travail a par ailleurs t initi par Breslin et al. (2005) dans le cas des blogs et des forums en lignes, et par Hausenblas & Rehatschek (2007) dans le cas des listes de diffusions. Dans le mme ordre d’ides, Buffa et al. (2008) ont outill l’dition collaborative de pages de wikis avec des fonctions de tagging social directement formalises dans les langages du Web Smantique. Troisimement, il est possible de confronter les diffrents types de groupes sociaux considrs. Les approche de Passant (2007) et de Good et al. (2007) s’inscrivent dans des contextes o le champ de connaissances est clairement identifi (un blog d’entreprise ou la biologie). Dans ce cas, il semble plus ais de concevoir un systme centralis de contrle IC 2008 du vocabulaire que dans le cadre des systmes ouverts de bookmarking sociaux (Kim et al., 2007) ou d’agrgation de revues d’objets culturels varis (Heath & Motta, 2007). Cependant, il est ncessaire de ne pas perdre de vue l’aspect social du partage des connaissances et de s’attacher concevoir des modles en adquation avec les usages. A cet gard Sinha (2006) propose une analyse sociale du tagging. Elle rappelle la distinction introduite par Mathes (2004) entre l’usage priv des services de bookmarking sociaux, o le tag a une utilisation personnelle dans le but de retrouver une ressource, et l’usage tourn vers le lien social, o le tag est choisi pour dcrire sans ambiguts une ressource destine tre partage. Sinha montre galement que l’annotation d’une ressource l’aide de plusieurs mots-cls (tags) est cognitivement moins lourde que l’effort du choix d’une catgorie unique. Le tagging se rvle donc plus simple, puisqu’il autorise taguer avec tous les concepts activs l’esprit par l’objet classer. D’autre part, dans les cas o les vues sur un champ de connaissances ne sont pas consensuelles, Zacklad (2007) suggre le recours des ontologies semi-structures, appeles “ontologies smiotiques” et exprimes selon le modle “HyperTopic” (Zacklad et al., 2007). Les ontologies smiotiques ncessitent cependant le recours un spcialiste des schmatisations de la connaissance, et ne constituent donc pas une alternative aussi spontane d’utilisation que les folksonomies. Nanmoins, elle peuvent tre considres comme une reprsentation intermdiaire aux ontologies formelles, au sens o l’oprationnalisation des ontologies smiotiques n’est pas “prolonge par une formalisation rfrentielle”. Il s’agit donc de considrer les processus de ngociations, discussions sur les connaissances partages comme le cœur du problme ; le but n’est pas d’aboutir a un schma formel oprationnel (ontologie formelle) mais une cartographie des connaissances ou des rseaux de description (Cahier et al., 2005). Gruber (2008) diffrencie intelligence collective et collection d’intelligences. Il donne trois caractristiques des systmes de collection d’intelligences : (1) une production de contenu soutenue par les utilisateurs du systme, (2) une synergie entre l’homme et la machine en particulier pour couvrir de larges domaines et (3) un gain augmentant avec l’chelle du domaine couvert. Pour passer d’une collection d’intelligences une intelligence collective, Gruber propose d’ajouter une quatrime caractristique : l’mergence de connaissances dpassant les connaissances fournies individuellement. Il suggre que cette quatrime caractristique puisse directement bnficier de l’intgration des technologies du Web smantique. Les approches proposes dans cet article montrent que la nature sociale des changes de connaissances n’est pas en contradiction avec les possibilits offertes par les systmes base d’ontologies formelles. Le point que nous abordons ici est symptomatique de la tension entre l’utilit de reprsentations formelles dans un systme base de connaissances et l’utilit de reprsentations informelles dans les interactions quotidiennes entre individus. Parce que les tags sont simples et naturels d’emploi, parce que les folksonomies se constituent d’elles mmes comme un effet secondaire de l’usage des tags, elles sont considres, juste titre, comme extrmement performantes puisqu’elles utilisent la masse et la diversit des utilisateurs pour organiser la masse et la diversit des ressources d’information. Parce qu’elles ont des mthodologies parfois lourdes, parce qu’elles reposent sur des formalismes complexes, les ontologies sont considres comme des objets coteux et difficilement rconciliables avec des interactions naturelles. Cependant, comme Rapprocher Ontologies et Folksonomies le montrent les exemples abords dans cet article, il est possible d’utiliser une ontologie pour dcrire une folksonomie, l’utilisation des tags ou tout autre activit lie aux usages du Web communautaire. Opposer ontologies et folksonomies n’a donc pas de raison dans l’absolu puisque, pour un scnario donn, elles peuvent avoir des rles complmentaires jouer dans une mme solution applicative. Enfin, lorsque l’on regarde les cycles de vie d’une ontologie et d’une folksonomie, les approches prsentes ici dvoilent une opportunit de faire cohabiter ces deux objets : (1) les scnarios d’utilisation d’une folksonomie finissent souvent par identifier des cas d’usages o l’on souhaiterait pouvoir exploiter plus avant des structures dans ces ensembles de tags ; (2) la cration et la maintenance d’une ontologie doivent toujours trouver des mthodes pour viter le goulot d’tranglement de l’acquisition des connaissances, par exemple en se nourrissant de folksonomies. Permettre de fusionner certaines structures d’une folksonomie et d’une ontologie, reprsenter explicitement et maintenir ces points de jonction ; grer les frictions entre les deux cycles de vie ; assister et automatiser le moins intrusivement possible les changes entre ces deux objets en arrire plan des usages ; tels sont notre avis des enjeux intressants et fertiles pour les systmes d’information communautaires. Remerciements au comit de relecture des confrences IC et GECO. Références A BEL F., F RANK M., H ENZE N., K RAUSE D., P LAPPERT D. & S IEHNDEL P. (2007). Groupme ! - Where Semantic Web meets Web 2.0. In ISWC/ASWC, volume 4825 of LNCS, p. 871–878 : Springer. A NGELETOU S., S ABOU M., S PECIA L. & M OTTA E. (2007). Bridging the Gap Between Folksonomies and the Semantic Web : an Experience Report. Proc. of ESWC workshop on Bridging the Gap between Semantic Web and Web. B RESLIN J., H ARTH A., B OJARS U. & D ECKER S. (2005). Towards SemanticallyInterlinked Online Communities. In ESWC 2005. B RICKLEY D. & M ILLER L. (2004). FOAF Vocabulary Specification. Namespace Document 2 Sept 2004, FOAF Project. http ://xmlns.com/foaf/0.1/. B UFFA M., G ANDON F., E RETEO G., S ANDER P. & FARON C. (2008). SweetWiki : A semantic Wiki. J. Web Sem., 6(1), 84–97. C AHIER J.-P., Z AHER L., P ÉTARD X., L EBOEUF J.-P. & G UITTARD C. (2005). Experimentation of a Socially Constructed “Topic Map” by the OSS Community. workshop on Knowledge Management and Organizational Memories, IJCAI-05. G OOD B., K AWAS E. & W ILKINSON M. (2007). Bridging the gap between Social Tagging and Semantic Annotation : E.D. the Entity Describer. Available from Nature Precedings. G REAVES M. & M IKA P. (2008). Semantic Web and Web 2.0. J. Web Sem., 6(1), 1–3. G RUBER T. (1993). A Translation Approach to Portable Ontology Specifications. Knowledge Acquisition, 5(2), 199–220. G RUBER T. (2005). Ontology of Folksonomy : A Mash-up of Apples and Oranges. In Conference on Metadata and Semantics Research (MTSR). IC 2008 G RUBER T. (2008). Collective knowledge systems : Where the Social Web meets the Semantic Web. J. Web Sem., 6(1), 4–13. H ALPIN H., ROBU V. & S HEPHERD H. (2007). The Complex Dynamics of Collaborative Tagging. In WWW : ACM Press. H AUSENBLAS M. & R EHATSCHEK H. (2007). mle : Enhancing the Exploration of Mailing List Archives Through Making Semantics Explicit. In Semantic Web Challenge, ISWC. H EATH T. & M OTTA E. (2007). Revyu.com : a Reviewing and Rating Site for the Web of Data. In ISWC/ASWC, volume 4825 of LNCS, p. 895–902 : Springer. J ÄSCHKE R., H OTHO A., S CHMITZ C., G ANTER B. & S TUMME G. (2008). Discovering Shared Conceptualizations in Folksonomies. J. Web Sem., 6(1), 38–53. K IM H.-L., YANG S.-K., S ONG S.-J., B RESLIN J. G. & K IM H.-G. (2007). Tag Mediated Society with SCOT Ontology. In Semantic Web Challenge, ISWC. M ATHES A. (2004). Folksonomies - Cooperative Classification and Communication Through Shared Metadata. Rapport interne, GSLIS, Univ. Illinois UrbanaChampaign. M IKA P. (2005). Ontologies are Us : a Unified Model of Social Networks and Semantics. In ISWC, volume 3729 of LNCS, p. 522–536 : Springer. N EWMAN R., AYERS D. & RUSSELL S. (2005). Tag Ontology Design. http ://www.holygoat.co.uk/owl/redwood/0.1/tags/. PASSANT A. (2007). Using Ontologies to Strengthen Folksonomies and Enrich Information Retrieval in Weblogs. In Int. Conf. Weblogs and Social Media. S CHMITZ C., H OTHO A., J ÄSCHKE R. & S TUMME G. (2006). Mining Association Rules in Folksonomies. Data Science and Classification, p. 261–270. S INHA R. (2006). Tagging from Personnal to Social : Observations and Design Principles. In Tagging Workshop, WWW. S PECIA L. & M OTTA E. (2007). Integrating folksonomies with the semantic web. 4th European Semantic Web Conference. TANASESCU V. & S TREIBEL O. (2007). ExtremeTagging : Emergent Semantics through the Tagging of Tags. In ESOE at ISWC. VANDERWAL T. (2004). Folksonomy Coinage and Definition. http ://www.vanderwal.net/folksonomy.html. Z ACKLAD M. (2007). Classification, Thésaurus, Ontologies, Folksonomies : Comparaisons du Point de vue de la Recherche Ouverte d’Information (ROI). In CAIS/ACSI. Z ACKLAD M., B ÉNEL A., C AHIER J., Z AHER L., L EJEUNE C. & Z HOU C. (2007). Hypertopic : une Métasémiotique et un Protocole pour le Web Socio-Sémantique. In IC, p. 217–228 : Cépaduès. ISBN 978-2-85428-790-9.