La densité dans les flots de liens révèle des groupes pertinents
Transcription
La densité dans les flots de liens révèle des groupes pertinents
universite pierre et marie curie - lip6 La densité dans les flots de liens révèle des groupes pertinents Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy LIP6 - CNRS & UPMC , Université Pierre et Marie Curie – Sorbonne Universités, Paris, France. [email protected] 12 Janvier 2016 universite pierre et marie curie - lip6 Résumé 1 Définition d’un flot de liens et de la densité 2 Trouver les groupes pertinents dans les flots de liens 3 Résultats 4 Conclusions et perspectives Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 2/16 universite pierre et marie curie - lip6 Qu’est ce qu’un flot de liens ? T = [α, ω] intervalle de temps, V ensemble de noeuds et E ⊆ T × T × V × V ensemble de liens. (b, e, u, v ) ∈ E ⇒ (u, v ) interagissent continuellement sur [b, e]. a b Exemple : Ensemble d’interactions de personnes. c d e f Time Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 3/16 universite pierre et marie curie - lip6 Quelle différence avec les autres modèles ? b Série de graphes b b c a c a d f e c a d f e d f e a b c Flot de liens d e f Time Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 4/16 universite pierre et marie curie - lip6 Comment étudier les flots de liens ? Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 5/16 universite pierre et marie curie - lip6 La densité dans les flots de liens a b c d e f Time Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 6/16 universite pierre et marie curie - lip6 La densité dans les flots de liens V 0 = {b, c, d, e} a b c d e f start time d Time d(V 0 , b, δ) = probabilité qu’il existe un lien entre 2 nœuds dans V 0 à un instant dans l’intervalle [b, b + δ]. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 6/16 universite pierre et marie curie - lip6 La densité dans les flots de liens V 0 = {b, c, d, e} a b c d e Si d = 0.13, est-ce important ? f start time d Time d(V 0 , b, δ) = probabilité qu’il existe un lien entre 2 nœuds dans V 0 à un instant dans l’intervalle [b, b + δ]. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 6/16 universite pierre et marie curie - lip6 Définition des références a b c d e f start time Time Référence sur le temps de début Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 7/16 universite pierre et marie curie - lip6 Définition des références a b c d e f d Référence sur la durée Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 7/16 Time universite pierre et marie curie - lip6 Définition des références a b c d e f Time Référence sur les nœuds Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 7/16 universite pierre et marie curie - lip6 Évaluation Density d* score = 1- dabove T dabove 0 Start time T • 0 ≤ scorer éf érence (E 0 ) ≤ 1 • Score élevé : le groupe est plus dense que la majorité des groupes pour la référence considérée. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 8/16 universite pierre et marie curie - lip6 Comment trouver les groupes pertinents ? Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 9/16 universite pierre et marie curie - lip6 Comment trouver les groupes pertinents ? a b c d Time ot de liens 1 Créer le graphe statique. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 10/16 graphe statique universite pierre et marie curie - lip6 Comment trouver les groupes pertinents ? a b c d Time ot de liens 1 2 graphe statique Créer le graphe statique. Méthode de détection de communauté sur le graphe statique. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 10/16 universite pierre et marie curie - lip6 Comment trouver les groupes pertinents ? a b c d Time ots de liens 1 2 3 graphe statique Créer le graphe statique. Méthode de détection de communauté sur le graphe statique. Récupération de la partition de liens dans le flot de liens. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 10/16 universite pierre et marie curie - lip6 Comment trouver les groupes pertinents ? a b c d Time ot de liens 1 2 3 4 graphe statique Créer le graphe statique. Méthode de détection de communauté sur le graphe statique. Récupération de la partition de liens dans le flot de liens. Application de la méthode d’évaluation pour garder certains groupes . Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 10/16 universite pierre et marie curie - lip6 Applications Jeux de données : plusieurs réseaux d’intéractions. Jeux de données |V | |E | L̄ Rollernet 62 15803 3 heures Socio pattern 180 19774 9 jours Reality Mining 94 44975 9 mois Baboon 28 95616 14 jours Table – Caractéristique de chaque jeux de données. |V | nombre de nœuds |E | nombre de liens dans le flot L̄ durée de la capture. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 11/16 universite pierre et marie curie - lip6 Socio pattern 51 47 35 56 14 38 32 13 1 2 23 22 21 9 12 31 25 34 39 17 49 33 15 19 4 45 3 52 46 20 30 18 37 36 43 40 29 41 42 54 7 16 57 28 8 10 6 11 26 24 27 50 53 55 60 48 44 59 58 61 5 62 Time 0 5 10 15 20 25 30 35 40 45 Figure – Visualisation d’une partie du flot de socio pattern. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 12/16 universite pierre et marie curie - lip6 Socio pattern 10 6 2 3 4 7 5 8 1 9 13 12 11 Time 0 5 10 15 20 25 30 35 Figure – Visualisation d’un groupe capturé dans le flot de liens. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 13/16 universite pierre et marie curie - lip6 Résultats Highlights • Des groupes ayant des scores très élevés dans chaque jeux de données. • Chaque nœud est en moyenne dans une dizaine de groupes. • À un instant donné, zéro, un ou plusieurs groupes peuvent exister. • Les groupes capturés ont une validation empirique. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 14/16 universite pierre et marie curie - lip6 Conclusions et perspectives En résumé : • Les flots de liens sont une extension temporelle des graphes. • La densité dans les flots mélange l’information temporelle et topologique. • La densité permet de mettre en valeur des groupes. Perspectives : • Trouver ou générer des jeux de données ayant une vérité de terrain. • Apporter d’autres métriques comme la modularité dans les flots de liens. Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016 15/16 Merci !