La densité dans les flots de liens révèle des groupes pertinents

Transcription

La densité dans les flots de liens révèle des groupes pertinents
universite pierre et marie curie - lip6
La densité dans les flots de liens
révèle des groupes pertinents
Noé Gaumont
Encadrants: Clémence Magnien et Matthieu Latapy
LIP6 - CNRS & UPMC , Université Pierre et Marie Curie – Sorbonne Universités, Paris,
France.
[email protected]
12 Janvier 2016
universite pierre et marie curie - lip6
Résumé
1
Définition d’un flot de liens et de la densité
2
Trouver les groupes pertinents dans les flots de liens
3
Résultats
4
Conclusions et perspectives
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
2/16
universite pierre et marie curie - lip6
Qu’est ce qu’un flot de liens ?
T = [α, ω] intervalle de temps, V ensemble de noeuds et
E ⊆ T × T × V × V ensemble de liens.
(b, e, u, v ) ∈ E ⇒ (u, v ) interagissent continuellement sur [b, e].
a
b
Exemple :
Ensemble d’interactions de
personnes.
c
d
e
f
Time
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
3/16
universite pierre et marie curie - lip6
Quelle différence avec les autres
modèles ?
b
Série de
graphes
b
b
c
a
c
a
d
f
e
c
a
d
f
e
d
f
e
a
b
c
Flot de liens d
e
f
Time
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
4/16
universite pierre et marie curie - lip6
Comment étudier les
flots de liens ?
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
5/16
universite pierre et marie curie - lip6
La densité dans les flots de liens
a
b
c
d
e
f
Time
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
6/16
universite pierre et marie curie - lip6
La densité dans les flots de liens
V 0 = {b, c, d, e}
a
b
c
d
e
f
start time
d
Time
d(V 0 , b, δ) = probabilité qu’il existe un lien entre 2 nœuds dans V 0 à un
instant dans l’intervalle [b, b + δ].
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
6/16
universite pierre et marie curie - lip6
La densité dans les flots de liens
V 0 = {b, c, d, e}
a
b
c
d
e
Si d = 0.13,
est-ce
important ?
f
start time
d
Time
d(V 0 , b, δ) = probabilité qu’il existe un lien entre 2 nœuds dans V 0 à un
instant dans l’intervalle [b, b + δ].
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
6/16
universite pierre et marie curie - lip6
Définition des références
a
b
c
d
e
f
start time
Time
Référence sur le temps de début
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
7/16
universite pierre et marie curie - lip6
Définition des références
a
b
c
d
e
f
d
Référence sur la durée
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
7/16
Time
universite pierre et marie curie - lip6
Définition des références
a
b
c
d
e
f
Time
Référence sur les nœuds
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
7/16
universite pierre et marie curie - lip6
Évaluation
Density
d*
score = 1-
dabove
T
dabove
0
Start time
T
• 0 ≤ scorer éf érence (E 0 ) ≤ 1
• Score élevé : le groupe est plus dense que la majorité des groupes pour
la référence considérée.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
8/16
universite pierre et marie curie - lip6
Comment trouver les
groupes pertinents ?
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
9/16
universite pierre et marie curie - lip6
Comment trouver les groupes
pertinents ?
a
b
c
d
Time
ot de liens
1
Créer le graphe statique.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
10/16
graphe statique
universite pierre et marie curie - lip6
Comment trouver les groupes
pertinents ?
a
b
c
d
Time
ot de liens
1
2
graphe statique
Créer le graphe statique.
Méthode de détection de communauté sur le graphe statique.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
10/16
universite pierre et marie curie - lip6
Comment trouver les groupes
pertinents ?
a
b
c
d
Time
ots de liens
1
2
3
graphe statique
Créer le graphe statique.
Méthode de détection de communauté sur le graphe statique.
Récupération de la partition de liens dans le flot de liens.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
10/16
universite pierre et marie curie - lip6
Comment trouver les groupes
pertinents ?
a
b
c
d
Time
ot de liens
1
2
3
4
graphe statique
Créer le graphe statique.
Méthode de détection de communauté sur le graphe statique.
Récupération de la partition de liens dans le flot de liens.
Application de la méthode d’évaluation pour garder certains groupes .
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
10/16
universite pierre et marie curie - lip6
Applications
Jeux de données : plusieurs réseaux d’intéractions.
Jeux de données |V |
|E |
L̄
Rollernet
62 15803 3 heures
Socio pattern
180 19774 9 jours
Reality Mining
94 44975 9 mois
Baboon
28 95616 14 jours
Table – Caractéristique de chaque jeux de données.
|V | nombre de nœuds
|E | nombre de liens dans le flot
L̄ durée de la capture.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
11/16
universite pierre et marie curie - lip6
Socio pattern
51
47
35
56
14
38
32
13
1
2
23
22
21
9
12
31
25
34
39
17
49
33
15
19
4
45
3
52
46
20
30
18
37
36
43
40
29
41
42
54
7
16
57
28
8
10
6
11
26
24
27
50
53
55
60
48
44
59
58
61
5
62
Time
0
5
10
15
20
25
30
35
40
45
Figure – Visualisation d’une partie du flot de socio pattern.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
12/16
universite pierre et marie curie - lip6
Socio pattern
10
6
2
3
4
7
5
8
1
9
13
12
11
Time
0
5
10
15
20
25
30
35
Figure – Visualisation d’un groupe capturé dans le flot de liens.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
13/16
universite pierre et marie curie - lip6
Résultats
Highlights
• Des groupes ayant des scores très élevés dans chaque jeux de données.
• Chaque nœud est en moyenne dans une dizaine de groupes.
• À un instant donné, zéro, un ou plusieurs groupes peuvent exister.
• Les groupes capturés ont une validation empirique.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
14/16
universite pierre et marie curie - lip6
Conclusions et perspectives
En résumé :
• Les flots de liens sont une extension temporelle des graphes.
• La densité dans les flots mélange l’information temporelle et
topologique.
• La densité permet de mettre en valeur des groupes.
Perspectives :
• Trouver ou générer des jeux de données ayant une vérité de terrain.
• Apporter d’autres métriques comme la modularité dans les flots de
liens.
Noé Gaumont Encadrants: Clémence Magnien et Matthieu Latapy — 12 Janvier 2016
15/16
Merci !