un tat de l`art. - Sophia Antipolis

Transcription

un tat de l`art. - Sophia Antipolis
Rapprocher les ontologies et les folksonomies
pour la gestion des connaissances partages : un
tat de l’art.
Freddy Limpens1 , Fabien Gandon1 , Michel Buffa2
1
Edelweiss, INRIA Sophia-Antipolis, France, 2004 route des lucioles - BP 93,
FR-06902 Sophia-Antipolis Cedex
{freddy.limpens, fabien.gandon}@sophia.inria.fr
2
KEWI, Laboratoire I3S, Universit de Nice, France
[email protected]
Résumé : Ces dernires annes, le “tagging social” s’est impos au sein du Web
2.0 comme le principal moyen de classification de donnes en trs grand nombre.
Nanmoins, l’emploi pour la classification d’ensembles de tags non contrls, appels folksonomies, pose plusieurs problmes : le problme de l’ambigut (un tag
dnotant plusieurs concepts), le problme de variations d’critures (plusieurs tags
dnotant un mme concept) et le manque d’assistance l’exploitation de ces structures (notamment pour la recherche ou l’change d’informations) en l’absence de
reprsentations explicites de ces connaissances partages. Cet article prsente un tat
de l’art comparatif et une discussion sur les travaux proposant une volution de ces
systmes base de folksonomies, en tenant compte, notamment, des travaux existant dans le domaine de la reprsentation des connaissances, en particulier ceux
base d’ontologies.
Mots-clés : Web social, Folksonomies, Ontologies, Partage de connaissances
1
Introduction
La classification et le partage des ressources au sein du Web posent plusieurs problmes auxquels prtendent rpondre les systmes de reprsentation base d’ontologies ainsi
que ceux reposant sur des folksonomies. Le terme folksonomie est un mot valise d’origine anglaise introduit par Vanderwal (2004) et exprimant l’ide d’une classification
(“taxonomy”) faite par les usagers (“folks”). Les ontologies sont des structures de reprsentation d’un champ de connaissance et visent “spcifier explicitement une conceptualisation” (Gruber, 1993). Plus particulirement, les ontologies formelles sont des spcifications de la conceptualisation d’un champ de connaissances l’aide de smantiques formelles, et sont exploitables par des programmes informatiques afin d’assister le partage
de ces connaissances travers diffrentes applications. Leur conception relve souvent d’un
processus engageant des ontologues, assists d’experts du domaine modliser. L’obstacle
IC 2008
majeur la gnralisation de l’emploi d’ontologies formelles au sein du Web est le cot
de leur laboration, de leur maintenance, et de leur exploitation pour l’annotation des
ressources.
Le partage de ressources tagues sur le Web 2.0 s’appelle le “tagging social” et produit
des folksonomies. Les folksonomies sont des organisations de ressources issues des
usages et leur obtention est non supervise. Ces folksonomies ouvrent de nombreuses
possibilits d’exploitation, pourvu qu’un systme de partage efficace des connaissances
et des ressources en tire profit. Dans cette perspective se dressent cependant certains
obstacles l’emploi des folksonomies comme reprsentation des connaissances (Mathes,
2004; Passant, 2007) : (1) l’ambigut des tags, car un tag peut dsigner plusieurs concepts ;
(2) les variations des critures des tags pour dsigner un mme concept ; (3) et le manque
d’assistance l’exploitation de ces structures (notamment pour la recherche ou l’change
d’informations) en l’absence de reprsentations explicites ou formelles de ces connaissances partages.
Un certain nombre de travaux se sont penchs sur ce problme de l’annotation des
documents et du partage des connaissances. Les systmes qu’ils proposent tentent de
rconcilier les modles de reprsentations des connaissances base d’ontologies et ceux base
de folksonomies. Dans une premire section nous prsentons les approches visant extraire
des liens smantiques entre les termes des folksonomies. Dans une deuxime section, les
contributions prsentes s’attachent soutenir les folksonomies l’aide d’ontologies. Enfin
nous abordons les travaux visant exploiter les formalismes du Web smantique pour
l’change de ressources.
2
mergences de structures dans les folksonomies
Les contributions prsentes dans cette partie analysent a posteriori la structure des
folksonomies pour obtenir une reprsentation de la structure smantique induite par les
communauts, comme premire tape suppose l’laboration d’ontologies.
2.1
Analyse des rseaux sociaux appliques aux folksonomies
Mika (2005) propose de considrer les folksonomies comme des structures smantiques
mergentes des usages de la communaut. Son objectif est de construire des “ontologies
lgres” (lightweight ontologies) partir de l’analyse de folksonomies. Mika propose un
modle “tripartite” des folksonomies o les instances sont des ressources Web associes
par un acteur une liste de concepts (les tags). Des mthodes d’analyse de rseaux sociaux sont ensuite utilises pour tisser des rseaux refltant les liens entre les concepts et
en dduire des regroupements de termes, ou des relations de subsumption (relation “isa”). Mika (2005) rapproche les concepts via deux perspectives en tissant (1) le rseau
liant les instances (ressources) aux concepts (tags) les caractrisant, et en rapprochant
les concepts (tags) ayant le plus d’instances en commun (2) le rseau liant les concepts
aux acteurs les utilisant et en rapprochant les concepts ayant le plus d’acteurs en commun. Le premier rseau donne un graphe concepts-instances refltant la co-occurrence
des tags sur les mmes ressources. Le deuxime donne un graphe concepts-acteurs refltant les recoupements entre communauts d’intrt. Dans ce dernier cas, une communaut
Rapprocher Ontologies et Folksonomies
d’intrt pourrait tre reprsente par l’ensemble des acteurs ayant utilis le tag “longitude”.
Si les communauts “longitude” et “latitude” ont un certain nombre d’acteurs en commun, les tags “longitude” et “latitude” seront considrs comme smantiquement proches.
Le graphe concepts-acteurs reflte de manire plus prcise la spcificit du vocabulaire utilis
par la communaut considre, car le rapprochement de deux termes ne peut se faire que
s’ils ont un grand nombre d’utilisateurs en commun. Il permet de surcrot de dduire des
relations du type “plus gnral / plus prcis” entre les termes. En effet si l’ensemble correspondant la communaut “pche sous-marine” est un sous-ensemble de la communaut
lie au tag “activits nautiques”, alors le tag “activits nautiques” est considr comme plus
gnral que le tag “pche sous-marine”.
2.2
Analyse de la dynamique des folksonomies
Halpin et al. (2007) analysent la dynamique des folksonomies et recherchent les lois
de distribution de la frquence d’utilisation des tags. La question qu’ils posent est celle
de la cohrence des folksonomies et, plus prcisment, celle de la stabilit de la distribution
des tags pour une ressource donne au cours du temps. Leur hypothse est que les tags
les plus utiliss pour annoter une ressource demeurent les mmes, et que la distribution
de leur frquence d’apparition suit une loi de puissance. Ils vrifient cette hypothse pour
les sept dix tags les plus utiliss pour caractriser des sites populaires sur un service de
bookmarking social 1 . L’analyse montre que la distribution des tags pour les sites les
plus populaires devient stable partir d’un temps quasiment constant. Par ailleurs, les
auteurs se sont intresss la recherche de liens smantiques entre les termes de ce vocabulaire l’aide de graphes de corrlations inter-tags. Chaque noeud de ces graphes reprsente
un tag sous forme d’un cercle dont le diamtre est pondr par la frquence d’apparition
de ce tag. La longueur des arcs reliant les tags co-occurrents est pondre par leur degr
de co-occurrence. Cette visualisation est un point de dpart possible pour l’laboration
d’ontologies plus structures.
2.3
Cluster en correspondance avec des ontologies
Specia & Motta (2007) effectuent un traitement statistique des annotations en regroupant les tags fortement lis entre eux pour former des clusters. La mthode choisie
consiste construire la matrice de co-occurrence des tags sur les mmes ressources, puis
calculer la distance angulaire entre chaque ligne de cette matrice. Cette distance est
exploite pour constituer des clusters de tags. La deuxime tape consiste expliciter les
liens pouvant exister entre les tags d’un mme cluster. Pour ce faire, le systme recherche
dans des ontologies du Web smantique la prsence de toutes les paires de tags de chaque
cluster. En cas de succs, le systme recherche les relations possibles existant entre les
tags de chaque paire. Une tentative d’automatisation plus complte de cette mthode a
par ailleurs t mene par Angeletou et al. (2007).
1. http ://del.icio.us
IC 2008
2.4
Fouille de donne et folksonomies
D’autres approches reprennent le modle tripartite des folksonomies de Mika (Mika,
2005) et appliquent des mthodes de fouille de donnes afin d’extraire des informations
sur la structure des folksonomies. Jäschke et al. (2008) exploitent les mthodes d’analyse formelle de concepts afin de dcouvrir les sous ensembles d’utilisateurs de folksonomies partageant la mme conceptualisation sur les mmes ressources. Pour ce faire
ils construisent des triples (Ressources, Utilisateurs, Tags) appels tri-concepts o chaque
utilisateur a tagu chaque ressource avec tous les tags. L’extraction des tri-concepts d’une
folksonomie constitue, selon les auteurs, une premire tape la construction d’ontologies.
Les ontologies sont ainsi vues comme des constructions sociales o un concept est dcrit
par un ensemble de tags appartenant un ensemble d’utilisateurs et utiliss pour caractriser un certain type de ressources.
D’autres techniques de fouille de donnes ont t appliques par Schmitz et al. (2006)
afin d’extraire des rgles d’association au sein des folksonomies. La premire tape est de
projeter le modle tripartite (Ressources, Utilisateurs, Tags) sur une structure deux dimensions, par exemple en considrant l’ensemble des couples (Utilisateurs, Ressources)
associs un ensemble de tags Tx . A partir de cette projection, un exemple de rgle d’association qu’il est possible d’extraire est le suivant : les Utilisateurs associant les tags de
l’ensemble TA un ensemble de Ressources, associent souvent les tags de l’ensemble TB
ces mmes ressources. Ce type de rgles pourrait tre notamment appliqu dans un systme
de recommandation de tags.
2.5
Structuration manuelle de folksonomies
Tanasescu & Streibel (2007) proposent pour structurer les folksonomies de rexploiter
les ressorts ayant fait le succs des applications du Web 2.0. Ils suggrent d’tendre les
systmes actuels de tagging social en permettant tous les utilisateurs de taguer les tags
eux mmes ou les relations pouvant exister entre certains tags. Ces relations peuvent
naturellement tre exprimes l’aide de triples, ce qui permet d’intgrer facilement ces
connaissances dans un moteur de recherche du Web smantique. Les auteurs soulvent
le problme de la pertinence des informations fournies par les utilisateurs qu’un systme
non centralis ne peut garantir. Afin d’y remdier, la rgulation d’un tel systme serait assure
par la communaut (cf. WikiPedia), et outille par la possibilit d’apprcier ou de dprcier un
tag, ou encore par des systmes de “points” gagns en fonctions de la participation en tant
qu’auteur ou mme navigateur. Ces procds visant inciter les contributions sont propres
aux plateformes sociales et pourraient par ailleurs tre tendus avec les “jeux srieux”. Les
“jeux srieux” sont des activits prsents sous un jour ludique, mais exploites des fins de
traitement de donnes complexes ncessitant de l’intelligence humaine moindre cot. Un
exemple de ce type de jeux est “The ESP Game” 2 o deux joueurs connects simultanment doivent se mettre d’accord sur le label (tag) attribuer une image qu’ils ont sous
les yeux. Les multiples annotations d’images ainsi fournies par les joueurs sont ensuite capitalises et mises disposition pour la recherche d’informations, ou la description
d’images aux non-voyants.
2. http ://www.espgame.org
Rapprocher Ontologies et Folksonomies
2.6
Conclusion partielle
Les rsultats des approches visant extraire la structure smantique des folksonomies
sont encourageants. Mika (2005) montre qu’il est possible d’extraire d’une folksonomie les termes les plus reprsentatifs d’une communaut ainsi que certaines relations
smantiques entre ces termes. Halpin et al. (2007) montrent de leur ct que les folksonomies lies aux sites les plus populaires prsentent des distributions stables et peuvent aussi
servir de base la construction d’ontologies. Les mthodes de fouille de donnes proposes
par Schmitz et al. (2006) et Jäschke et al. (2008) apportent des perspectives sur les
folksonomies en vue d’une explicitation plus avance. Cependant les structures extraites
automatiquement souffrent encore de l’ambigut des liens tablis entre les concepts. Si
nous prenons l’exemple des concepts “vhicules, avions, pilotes”, il serait possible, partir des mthodes proposes par Mika, d’infrer un lien entre ces trois termes, puis un lien
de subsumption entre “avions” et “vhicules”. Mais le lien entre “avions” et “pilotes”
n’est pas un lien de subsumption, et le typage de ce lien requiert une expertise du domaine concern. Reposant sur le dynamisme du Web social, Tanasescu & Streibel (2007)
suggrent quant eux d’impliquer les utilisateurs dans la qualification des liens entre tags,
tandis que Specia & Motta (2007) entreprennent cette tche en interrogeant les ontologies du Web smantique.
3
Ontologies comme support des folksonomies
Dans cette partie nous abordons les travaux proposant d’apporter un support formel
aux folksonomies, soit en faisant des tags les attributs des concepts d’une ontologie
formelle (Passant, 2007; Good et al., 2007) soit en rifiant les tags eux mmes et en crant
une “ontologie de folksonomie” (Gruber, 2005; Buffa et al., 2008; Newman et al., 2005;
Kim et al., 2007).
3.1
Guider le tagging l’aide d’ontologies
De nombreuses solutions visant intgrer le plus naturellement possible interface de tagging et systmes base d’ontologies ont rcemment vu le jour. Passant (2007) propose de
structurer une folksonomie pendant l’annotation des billets d’un blog d’entreprise par
l’intermdiaire d’un systme centralis ; ici un tag est une proprit (hasTag) d’un concept
d’une ontologie contrle. L’ontologie subordonne l’annotation en aiguillant le choix du
tag : il s’agit en fait pour l’utilisateur de rutiliser un label existant, ou de proposer un
nouveau label pour un concept qui existe dj. Cependant l’utilisateur reste libre de soumettre l’administrateur un concept et son label (tag) s’il n’existe pas encore. L’intrt
vient de ce que l’ambigut des tags par rapport aux concepts qu’ils sont censs dsigner
est automatiquement leve : si l’utilisateur propose un tag qui peut tre reli deux concepts
diffrents (par exemple “EDF” pour “lectricit De France” ou pour “quipe De France”), le
systme propose de choisir parmi les diffrentes possibilits. Le billet annot par son auteur
sera lui aussi reli au concept slectionn afin de lever l’ambigut des tags au moment de
la consultation du blog, en permettant de ne rcuprer que les billets lis au concept voulu
et non ceux lis tous les concepts associs un tag donn. Suivant une dmarche similaire,
IC 2008
Good et al. (2007) proposent un accs des terminologies professionnelles aux utilisateurs d’un service de bookmarking social, Connotea 3 . Ainsi les utilisateurs ajoutant des
tags une ressource peuvent choisir parmi une suggestion, faite par le systme, de termes
extraits d’ontologies. Le systme faisant coexister des termes librement choisis et des
termes issus de terminologies contrles, les auteurs suggrent d’exploiter l’ensemble de
ces annotations pour en dduire des relations existantes entre ces deux types de termes.
Dans une perspective de gnralisation, il semble que ce type de mthode ncessitent de
connaitre a priori le domaine de connaissances concern afin de guider la slection des
ontologies interroger pour suggrer des termes.
3.2
Construire une ontologie de folksonomie
Dans son article, Gruber (2005) pose qu’il n’y a pas d’opposition entre les ontologies et les folksonomies et propose de construire une “ontologie de folksonomie”. La
“TagOntology” est un projet de construction d’une ontologie commune ddie la formalisation et la conceptualisation de l’acte d’annoter une ressource par un terme (tagging).
Ce modle met en œuvre quatre entits pour caractriser un vnement de “tagging” : l’objet
tagu, ou la ressource ; le tag, c’est dire le mot-cl utilis ; l’utilisateur taguant ; et le domaine au sein duquel le tagging s’inscrit (ce peut tre le service utilis par exemple). A
la diffrence de Passant (2007), pour qui le tag est une simple chane de caractres relie
des concepts d’ontologies formelles, Gruber va plus loin dans la rification des tags et
considre chaque tag comme un objet part entire. Pour contrer les ambiguts des tags ou
les usages abusifs (spam), Gruber proposait dj de “tagger les tags”. Par ce biais, il serait
possible d’indiquer que tel tag est synonyme de tel autre tag, ou encore que tel tag est
adquat ou non pour tel objet. Kim et al. (2007) proposent quant eux l’ontologie SCOT 4
pour reprsenter les nuages de tags afin de faciliter leur partage (section 4.2). Buffa et al.
(2008) ont de leur ct appliqu l’ide d’exprimer les tags directement l’aide des langages
du Web smantique. Les tags sont donc collects comme autant de nouvelles classes d’ontologie et servent annoter les pages d’un wiki “smantique” (section 4.3).
3.3
Conclusion partielle
Dans cette partie nous avons montr que les approches base d’ontologies peuvent
tre appliques aux folksonomies, apportant une richesse supplmentaire illustre par des
exemples concrets d’implmentation. Passant (2007) fait de chaque tag une proprit rattache des concepts dans l’ontologie d’une entreprise. Cette approche permet, au cours
de l’utilisation, de lever l’ambigut des tags, mais galement d’enrichir l’ontologie lorsqu’un nouveau tag ne correspond aucun concept existant. Gruber (2005) a introduit
l’ide d’une “ontologie de folksonomie”, o chaque vnement de tagging a des attributs lis
(tag, objet dsign par le tag, tagueur, ressource concerne, etc.).
3. Connotea : http ://www.connotea.org/
4. http ://scot-project.org/scot/ns
Rapprocher Ontologies et Folksonomies
4
Ontologies et folksonomies sur le Web
Les pratiques du Web 2.0 et les technologies du Web smantique s’intressent toutes
les deux, mais de faons diffrentes, la notion d’un partage social du sens, et ces dernires
annes ont montr la complmentarit de ces approches (Greaves & Mika, 2008). Les approches de cette section proposent d’exploiter les formalismes du Web smantique en
vue de favoriser l’interconnexion des sites Web usages communautaires. Ici pas d’ontologie de domaine, mais des annotations reposant sur des ontologies formelles visant
relier efficacement les ressources entre elles. Ces approches peuvent constituer une position intermdiaire qui peut rester indpendante ou non d’un couplage avec des ontologies de domaine.
4.1
Communauts en ligne interconnectes
Le projet SIOC (Breslin et al., 2005) offre un cadre formel et technologique pour
dcrire les ressources changes sur les blogs et forums de discussions, et plus gnralement
sur toute plateforme sociale d’changes en ligne. L’ontologie propose utilise d’autres ontologies du Web smantique, comme SKOS 5 , dcrivant les systmes d’organisation simple
de la connaissance, et FOAF 6 (Brickley & Miller, 2004) pour dcrire les identits et les
accointances d’un utilisateur. SIOC 7 dcrit les lments prsents dans la plupart des sites
communautaires : la notion de “site”, comme emplacement de la communaut ; la notion
de “post”, ou billet pour un blog ; la notion de “forum” ; la notion “d’utilisateur” ; etc.
A partir de ce vocabulaire Breslin et al. (2005) proposent des extensions pour extraire
ces annotations de plateformes courantes (ex : Wordpress 8 ).
4.2
Ressources sur le Web
De nombreux autres travaux ont cherch intgrer plusieurs ontologies dans le but de
structurer les donnes en vue de leur partage.
Hausenblas & Rehatschek (2007) proposent avec “mle” un systme permettant le traitement automatique des listes de diffusion par emails, dans le but de constituer une
base de connaissances conforme aux standards du Web smantique. Cette approche utilise SIOC pour reprsenter les champs des emails (objet, metteurs, rcepteurs, etc.). Ces
annotations exprimes en RDF peuvent ensuite tre mises disposition d’un service Web,
pour pouvoir tre interroges grce au langage de requte du Web Smantique SPARQL 9 .
Le projet Revyu 10 (Heath & Motta, 2007) propose de mettre en pratique les principes
du “Web of Data” (Web de Donnes) pour organiser le partage de revues de contenus
culturels (livres, films de cinma, etc.). Parmis les principes du “Web de Donnes” prco5.
6.
7.
8.
9.
10.
SKOS : Simple Knowledge Organisation System, http ://www.w3.org/2004/02/skos/
FOAF : Friend Of A Friend, http ://www.foaf-project.org/
SIOC Ontology http ://www.w3.org/Submission/2007/SUBM-sioc-applications-20070612/
Logiciel de blog Wordpress, http ://wordpress.org/
SPARQL Query Language for RDF : http ://www.w3.org/TR/rdf-sparql-query/
http ://revyu.com/
IC 2008
niss par Tim-Berners Lee 11 nous pouvons citer : l’utilisation d’URIs comme noms et
sous forme de lien HTTP pour faciliter l’accessibilit un maximum d’information sur
chaque item index et l’interconnexion avec d’autres URIs. Les formalismes du Web
Smantique permettent de raliser ces principes 12 , et Revyu les implmente pleinement :
(1) en permettant d’accder des donnes stockes sur d’autres dpts afin d’viter la redondance d’informations ; (2) en utilisant RDF pour l’annotation ; et (3) en ne restreignant
pas le domaine couvert, puisque Revyu n’impose pas un ensemble dfini d’ontologies,
mais utilise des sources externes pour catgoriser les items.
D’autres approches visant structurer smantiquement des contributions annotes l’aide
de tags ont rcemment t proposes, comme GroupMe ! 13 (Abel et al., 2007) ou inter.est 14
(Kim et al., 2007) et consistent enrichir les services de bookmarking social (tel que
del.icio.us) l’aide des technologies du Web smantique. L’objectif de intere.st est d’intgrer les apports du Web smantique un service de bookmarking social, et l’ontologie
SCOT 15 en est le support. Cette ontologie permet de dcrire les termes d’un nuage de
tags (ensembles de tags relis des ressources et appartenant des utilisateurs) dans le but
d’instrumenter son partage. Le service propos vise agrger des nuages de tags, former
des groupes d’change et faciliter la recherche de nuages de tags similaires, refltant ainsi
les communauts d’intrt en germe.
4.3
Wikis smantiques
Les wikis “smantiques” ont t parmis les pionniers dans l’utilisation d’ontologies
formelles en “soutien” aux folksonomies. SweetWiki (Buffa et al., 2008) en est un
exemple : les utilisateurs peuvent diter et modifier des pages, mais aussi taguer des
pages, des images, des vidos, etc. Les tags sont relis entre eux au sein d’une folksonomie reprsente l’aide des langages du Web smantique. Les nouveaux tags sont collects
comme labels (termes) de nouvelles classes qui sont subsumes par dfaut par la classe
“nouveaux concepts”. Ensuite, et selon les principes de contribution et de rgulation
collective observ au sein du Web 2.0, des utilisateurs peuvent organiser les tags de la
folksonomie, les diter, ajouter des labels dans d’autres langues, crer des relations de
synonymie, fusionner des classes, etc.
Les auteurs de pages peuvent utiliser galement les tags pour proposer des fonctionnalits de “veille” : chaque utilisateur peut dans sa page personnelle spcifier une liste de
tags correspondant aux sujets qui l’intressent. Par exemple, un utilisateur intress par les
“wikis”, entrera le tag “wiki” dans sa page personnelle : sa page contiendra dsormais
une liste de liens vers des pages tagues avec “wiki” ou avec une sous-classe de ce mot-cl
dans la folksonomie organise. Cette approche permet de surveiller des ressources qui
n’existent pas encore : si aucune page ne parle de “wiki”, lorsqu’une page avec ce tag
ou un de ses sous-tag est cre, l’utilisateur est notifi. En gardant trace des pages cres et
modifies, des documents tagus et surveills, et en analysant le comportement des utili11.
12.
13.
14.
15.
La Recherche (nov 2007) : “L’avenir d’Internet. Tim Berners-Lee : Le Web va changer de dimension”
pour plus de dtails voir galement : http ://linkeddata.org/
http ://groupme.org/
http ://int.ere.st/
http ://scot-project.org/scot/ns
Rapprocher Ontologies et Folksonomies
sateurs au cours du temps, il est possible de dtecter des rseaux d’accointances ou des
communauts d’intrts. Les possibilits alors offertes sont multiples : trouver la personne
la plus active sur un sujet donn, trouver des utilisateurs utilisant le plus de tags quivalents, infrer des relations entre les tags lorsqu’ils partagent des utilisateurs communs,
des ressources communes, etc.
4.4
Conclusion partielle
Nous avons ainsi vu l’apport des formalismes du Web smantique aux services de partages de connaissance fonds sur des contributions de revues (Revyu), ou de bookmark
(intere.st, GroupMe !) ou encore de pages de wiki (SweetWiki). GroupMe ! et intere.st
mettent cependant l’accent sur les changes sociaux qui accompagnent l’utilisation de
ces services, tandis que Revyu se concentre sur l’application des principes du Web de
donnes en favorisant l’interconnexion des ressources. Les wikis smantiques ont permis quant eux de montrer l’intrt des ontologies comme support d’une connaissance “en
construction”. Buffa et al. (2008) proposent ainsi de factoriser la rorganisation des tagsconcepts, en permettant chaque utilisateur de modifier la folksonomie et de fusionner
certains tags-concepts, de proposer des synonymes, etc. Ces travaux montrent galement
les possibilits apportes par le format RDF, en implmentant des solutions de partage des
connaissances reposant sur des structures ontologiques.
5
Discussion
Dans cet article nous avons compar diffrentes approches visant rapprocher ontologies et folksonomies pour l’indexation des ressources partages. Ces approches, souvent
complmentaires, peuvent tre considres selon diffrents axes.
Premirement, selon un axe structuration/formalisation suivant lequel : (a) soit on
cherche analyser les tags et infrer des relations smantiques entre les lments de folksonomies en vue de leur structuration (section 2) ; (b) soit on cherche guider l’indexation des interactions et des contributions aux folksonomies grce une formalisation base
d’ontologies (sections 3 et 4).
Deuximement, on pourra chercher distinguer les types de ressources annotes et la
stratgie adopte. Abel et al. (2007) et Kim et al. (2007) cherchent assister le partage
de bookmarks avec des ontologies (notamment SKOS, SIOC, et FOAF) visant assister
l’interconnexion des ressources et des personnes au sein des communauts en lignes.
Ce mme travail a par ailleurs t initi par Breslin et al. (2005) dans le cas des blogs et
des forums en lignes, et par Hausenblas & Rehatschek (2007) dans le cas des listes de
diffusions. Dans le mme ordre d’ides, Buffa et al. (2008) ont outill l’dition collaborative
de pages de wikis avec des fonctions de tagging social directement formalises dans les
langages du Web Smantique.
Troisimement, il est possible de confronter les diffrents types de groupes sociaux
considrs. Les approche de Passant (2007) et de Good et al. (2007) s’inscrivent dans des
contextes o le champ de connaissances est clairement identifi (un blog d’entreprise ou
la biologie). Dans ce cas, il semble plus ais de concevoir un systme centralis de contrle
IC 2008
du vocabulaire que dans le cadre des systmes ouverts de bookmarking sociaux (Kim
et al., 2007) ou d’agrgation de revues d’objets culturels varis (Heath & Motta, 2007).
Cependant, il est ncessaire de ne pas perdre de vue l’aspect social du partage des
connaissances et de s’attacher concevoir des modles en adquation avec les usages. A cet
gard Sinha (2006) propose une analyse sociale du tagging. Elle rappelle la distinction
introduite par Mathes (2004) entre l’usage priv des services de bookmarking sociaux,
o le tag a une utilisation personnelle dans le but de retrouver une ressource, et l’usage
tourn vers le lien social, o le tag est choisi pour dcrire sans ambiguts une ressource
destine tre partage. Sinha montre galement que l’annotation d’une ressource l’aide de
plusieurs mots-cls (tags) est cognitivement moins lourde que l’effort du choix d’une
catgorie unique. Le tagging se rvle donc plus simple, puisqu’il autorise taguer avec tous
les concepts activs l’esprit par l’objet classer.
D’autre part, dans les cas o les vues sur un champ de connaissances ne sont pas
consensuelles, Zacklad (2007) suggre le recours des ontologies semi-structures, appeles “ontologies smiotiques” et exprimes selon le modle “HyperTopic” (Zacklad et al.,
2007). Les ontologies smiotiques ncessitent cependant le recours un spcialiste des schmatisations de la connaissance, et ne constituent donc pas une alternative aussi spontane
d’utilisation que les folksonomies. Nanmoins, elle peuvent tre considres comme une
reprsentation intermdiaire aux ontologies formelles, au sens o l’oprationnalisation des
ontologies smiotiques n’est pas “prolonge par une formalisation rfrentielle”. Il s’agit
donc de considrer les processus de ngociations, discussions sur les connaissances partages comme le cœur du problme ; le but n’est pas d’aboutir a un schma formel oprationnel (ontologie formelle) mais une cartographie des connaissances ou des rseaux de
description (Cahier et al., 2005).
Gruber (2008) diffrencie intelligence collective et collection d’intelligences. Il donne
trois caractristiques des systmes de collection d’intelligences : (1) une production de
contenu soutenue par les utilisateurs du systme, (2) une synergie entre l’homme et la
machine en particulier pour couvrir de larges domaines et (3) un gain augmentant avec
l’chelle du domaine couvert. Pour passer d’une collection d’intelligences une intelligence collective, Gruber propose d’ajouter une quatrime caractristique : l’mergence de
connaissances dpassant les connaissances fournies individuellement. Il suggre que cette
quatrime caractristique puisse directement bnficier de l’intgration des technologies du
Web smantique.
Les approches proposes dans cet article montrent que la nature sociale des changes
de connaissances n’est pas en contradiction avec les possibilits offertes par les systmes
base d’ontologies formelles. Le point que nous abordons ici est symptomatique de la
tension entre l’utilit de reprsentations formelles dans un systme base de connaissances
et l’utilit de reprsentations informelles dans les interactions quotidiennes entre individus. Parce que les tags sont simples et naturels d’emploi, parce que les folksonomies
se constituent d’elles mmes comme un effet secondaire de l’usage des tags, elles sont
considres, juste titre, comme extrmement performantes puisqu’elles utilisent la masse
et la diversit des utilisateurs pour organiser la masse et la diversit des ressources d’information. Parce qu’elles ont des mthodologies parfois lourdes, parce qu’elles reposent
sur des formalismes complexes, les ontologies sont considres comme des objets coteux et difficilement rconciliables avec des interactions naturelles. Cependant, comme
Rapprocher Ontologies et Folksonomies
le montrent les exemples abords dans cet article, il est possible d’utiliser une ontologie
pour dcrire une folksonomie, l’utilisation des tags ou tout autre activit lie aux usages du
Web communautaire. Opposer ontologies et folksonomies n’a donc pas de raison dans
l’absolu puisque, pour un scnario donn, elles peuvent avoir des rles complmentaires
jouer dans une mme solution applicative.
Enfin, lorsque l’on regarde les cycles de vie d’une ontologie et d’une folksonomie,
les approches prsentes ici dvoilent une opportunit de faire cohabiter ces deux objets :
(1) les scnarios d’utilisation d’une folksonomie finissent souvent par identifier des cas
d’usages o l’on souhaiterait pouvoir exploiter plus avant des structures dans ces ensembles de tags ; (2) la cration et la maintenance d’une ontologie doivent toujours trouver des mthodes pour viter le goulot d’tranglement de l’acquisition des connaissances,
par exemple en se nourrissant de folksonomies. Permettre de fusionner certaines structures d’une folksonomie et d’une ontologie, reprsenter explicitement et maintenir ces
points de jonction ; grer les frictions entre les deux cycles de vie ; assister et automatiser le moins intrusivement possible les changes entre ces deux objets en arrire plan des
usages ; tels sont notre avis des enjeux intressants et fertiles pour les systmes d’information communautaires.
Remerciements au comit de relecture des confrences IC et GECO.
Références
A BEL F., F RANK M., H ENZE N., K RAUSE D., P LAPPERT D. & S IEHNDEL P. (2007).
Groupme ! - Where Semantic Web meets Web 2.0. In ISWC/ASWC, volume 4825 of
LNCS, p. 871–878 : Springer.
A NGELETOU S., S ABOU M., S PECIA L. & M OTTA E. (2007). Bridging the Gap
Between Folksonomies and the Semantic Web : an Experience Report. Proc. of
ESWC workshop on Bridging the Gap between Semantic Web and Web.
B RESLIN J., H ARTH A., B OJARS U. & D ECKER S. (2005). Towards SemanticallyInterlinked Online Communities. In ESWC 2005.
B RICKLEY D. & M ILLER L. (2004). FOAF Vocabulary Specification. Namespace
Document 2 Sept 2004, FOAF Project. http ://xmlns.com/foaf/0.1/.
B UFFA M., G ANDON F., E RETEO G., S ANDER P. & FARON C. (2008). SweetWiki :
A semantic Wiki. J. Web Sem., 6(1), 84–97.
C AHIER J.-P., Z AHER L., P ÉTARD X., L EBOEUF J.-P. & G UITTARD C. (2005). Experimentation of a Socially Constructed “Topic Map” by the OSS Community. workshop on Knowledge Management and Organizational Memories, IJCAI-05.
G OOD B., K AWAS E. & W ILKINSON M. (2007). Bridging the gap between Social
Tagging and Semantic Annotation : E.D. the Entity Describer. Available from Nature
Precedings.
G REAVES M. & M IKA P. (2008). Semantic Web and Web 2.0. J. Web Sem., 6(1), 1–3.
G RUBER T. (1993). A Translation Approach to Portable Ontology Specifications.
Knowledge Acquisition, 5(2), 199–220.
G RUBER T. (2005). Ontology of Folksonomy : A Mash-up of Apples and Oranges. In
Conference on Metadata and Semantics Research (MTSR).
IC 2008
G RUBER T. (2008). Collective knowledge systems : Where the Social Web meets the
Semantic Web. J. Web Sem., 6(1), 4–13.
H ALPIN H., ROBU V. & S HEPHERD H. (2007). The Complex Dynamics of Collaborative Tagging. In WWW : ACM Press.
H AUSENBLAS M. & R EHATSCHEK H. (2007). mle : Enhancing the Exploration of
Mailing List Archives Through Making Semantics Explicit. In Semantic Web Challenge, ISWC.
H EATH T. & M OTTA E. (2007). Revyu.com : a Reviewing and Rating Site for the Web
of Data. In ISWC/ASWC, volume 4825 of LNCS, p. 895–902 : Springer.
J ÄSCHKE R., H OTHO A., S CHMITZ C., G ANTER B. & S TUMME G. (2008). Discovering Shared Conceptualizations in Folksonomies. J. Web Sem., 6(1), 38–53.
K IM H.-L., YANG S.-K., S ONG S.-J., B RESLIN J. G. & K IM H.-G. (2007). Tag
Mediated Society with SCOT Ontology. In Semantic Web Challenge, ISWC.
M ATHES A. (2004). Folksonomies - Cooperative Classification and Communication Through Shared Metadata. Rapport interne, GSLIS, Univ. Illinois UrbanaChampaign.
M IKA P. (2005). Ontologies are Us : a Unified Model of Social Networks and Semantics. In ISWC, volume 3729 of LNCS, p. 522–536 : Springer.
N EWMAN R., AYERS D. & RUSSELL S. (2005).
Tag Ontology Design.
http ://www.holygoat.co.uk/owl/redwood/0.1/tags/.
PASSANT A. (2007). Using Ontologies to Strengthen Folksonomies and Enrich Information Retrieval in Weblogs. In Int. Conf. Weblogs and Social Media.
S CHMITZ C., H OTHO A., J ÄSCHKE R. & S TUMME G. (2006). Mining Association
Rules in Folksonomies. Data Science and Classification, p. 261–270.
S INHA R. (2006). Tagging from Personnal to Social : Observations and Design Principles. In Tagging Workshop, WWW.
S PECIA L. & M OTTA E. (2007). Integrating folksonomies with the semantic web. 4th
European Semantic Web Conference.
TANASESCU V. & S TREIBEL O. (2007). ExtremeTagging : Emergent Semantics
through the Tagging of Tags. In ESOE at ISWC.
VANDERWAL T. (2004).
Folksonomy Coinage and Definition.
http ://www.vanderwal.net/folksonomy.html.
Z ACKLAD M. (2007). Classification, Thésaurus, Ontologies, Folksonomies : Comparaisons du Point de vue de la Recherche Ouverte d’Information (ROI). In CAIS/ACSI.
Z ACKLAD M., B ÉNEL A., C AHIER J., Z AHER L., L EJEUNE C. & Z HOU C. (2007).
Hypertopic : une Métasémiotique et un Protocole pour le Web Socio-Sémantique. In
IC, p. 217–228 : Cépaduès. ISBN 978-2-85428-790-9.