1 - IRMA
Transcription
1 - IRMA
Cours 6 CLASSIFICATION Master 1 – 2007/2008 1 Les données Modèle ____________________ Honda Civic Renault 19 Fiat Tipo Peugeot 405 Renault 21 Citroën BX BMW 530i Rover 827i Renault 25 Opel Omega Peugeot 405 Break Ford Sierra BMW 325ix Audi 90 Quattro Ford Scorpio Renault Espace Nissan Vanette VW Caravelle Ford Fiesta Fiat Uno Peugeot 205 Peugeot 205 Rallye Seat Ibiza SXI Citroën AX Sport 2 Cylindrée _________ Puissance _________ Vitesse ________ Poids ________ Longueur ________ Largeur ________ 1396 1721 1580 1769 2068 1769 2986 2675 2548 1998 1905 1993 2494 1994 2933 1995 1952 2109 1117 1116 1580 1294 1461 1294 90 92 83 90 88 90 188 177 182 122 125 115 171 160 150 120 87 112 50 58 80 103 100 95 174 180 170 180 180 182 226 222 226 190 194 185 208 214 200 177 144 149 135 145 159 189 181 184 850 965 970 1080 1135 1060 1510 1365 1350 1255 1120 1190 1300 1220 1345 1265 1430 1320 810 780 880 805 925 730 369 415 395 440 446 424 472 469 471 473 439 451 432 439 466 436 436 457 371 364 370 370 363 350 166 169 170 169 170 168 175 175 180 177 171 172 164 169 176 177 169 184 162 155 156 157 161 160 Exemple Auto88 Le premier plan principal 3 Exemple Auto88 Le cercle des corrélations 4 La classification : « Qui se ressemble s’assemble » 5 Dendrogramme 19 18 17 16 15 14 7 3 81groups 9 6 5 4 2 group Choosing the “cutting” level x Definition of the clusters 6 x x Classification ascendante hiérarchique (Méthode de Ward) Xp* * * ** ** *g* * 1 * * *** X1* * * * *g2 * * * * ** * * X 2 * *g3 ** ** * * Distance de Ward : D(Gi, Gj) = 7 ni n j (ni nj ) d 2 ( gi , g j ) n t r é o a n n e o s d r g d a s g i è d u r s e n l 1 1 6 3 7 7 6 0 0 H 3 2 0 o 2 5 2 3 5 2 1 9 2 R 3 9 2 e 3 9 1 1 4 5 8 1 9 F 2 3 2 i a 4 1 2 3 4 2 0 0 2 P 4 5 2 e 5 6 2 0 9 5 7 2 2 R 5 1 2 e 6 1 4 2 5 0 0 0 3 C 1 8 9 i t 7 1 0 3 2 0 6 7 2 B 3 0 6 M 8 3 4 0 4 0 6 3 3 R 4 7 6 o 9 6 0 3 9 5 6 2 2 R 9 5 9 e 1 0 1 7 2 4 6 4 5 4 O 6 4 7 p 1 1 9 3 4 2 8 2 2 3 P 0 1 3 e 1 2 3 7 4 1 1 5 4 6 F 4 2 4 o 1 3 7 8 2 5 3 4 8 8 B 1 2 1 M 1 4 9 2 7 2 2 6 5 6 A 4 1 2 u 1 5 3 7 1 7 3 5 7 1 F 7 4 6 o 1 6 6 4 6 4 6 8 3 1 R 9 9 7 e 1 7 8 5 8 4 2 7 8 0 N 6 9 2 i s 1 8 4 5 0 5 8 4 3 2 V 8 7 2 W 1 9 4 0 0 2 9 5 2 7 F 6 4 3 o 2 0 3 1 3 9 0 7 5 0 F 7 3 7 i a 2 1 6 5 0 4 7 8 8 5 P 2 8 7 e 2 2 7 3 2 4 4 0 5 5 P 8 8 6 e 2 3 5 8 0 1 2 3 2 3 S 7 7 3 e 2 4 8 3 5 3 5 0 1 6 C 4 2 4 i t M e 0 0 0 0 0 0 0 0 0 0 0 S t d 0 0 0 0 0 0 0 0 0 0 0 Calculer la distance de Ward entre la BX et la 405 ? 8 Tableau des distances entre les voitures i t y c l i d 3 e C : u S i g t X n 4 a d n r z C a 0 o t a a a s u ë 5 a T 1 : 1 0 9 9 7 4 0 3 9 . 2 : 9 9 8 4 6 7 2 2 2 3 : 5 9 7 4 8 4 0 3 6 4 : 2 7 8 6 8 9 1 3 3 5 : 6 4 0 7 4 9 7 5 0 6 : 0 2 0 1 7 . . . 2 3 3 6 2 3 3 5 6 4 2 4 6 9 2 6 3 0 3 4 T h 1 1 .181 .0905 D(Citroën BX, Peugeot 405) = (1 1) 9 Classification Ascendante Hiérarchique Etape initiale Chaque individu forme une classe. On regroupe les deux individus les plus proches. Etape courante A chaque étape, on regroupe les deux classes Gi et Gj minimisant le critère de Ward D(Gi, Gj). 10 * * * * * * H I E R A R C H I C A L Dendrogram using Ward Method C L U S T E R A N A L Y S I S * * * * * * Rescaled Distance Cluster Combine C A S E Label Peugeot 405 Citroën BX Renault 19 Renault 21 Fiat Tipo Peugeot 405 Break Ford Sierra Opel Omega Renault Espace Nissan Vanette VW Caravelle BMW 325ix Audi 90 quattro Rover 827i Renault 25 BMW 530i Ford Scorpio Peugeot 205 rallye Citroën AX sport Honda Civic Seat Ibiza sxi Ford Fiesta Fiat Uno Peugeot 205 11 Num 0 5 10 15 20 25 +---------+---------+---------+---------+---------+ 4 6 2 5 3 11 12 10 16 17 18 13 14 8 9 7 15 22 24 1 23 19 20 21 Qualité de la typologie en K classes 12 La somme des carrés expliquée par la typologie en K classes est égale à la somme des carrés inter-classes de la typologie en K classes. La qualité de la typologie est mesurée par la part de la somme des carrés totale expliquée par la typologie. Décomposition de l’inertie totale Xp* * * * *g1 * * * * X1* 13 = * * * * g3 * * ** X2* K K i i I( N, g) Inertie totale = p * * * * * g2* * * g ni 2 d (g i , g ) 1 n ni I(G i , g i ) 1 n Inertie inter-classes + Inertie intra-classes Coefficient : Somme des carrés intra-classes de la typologie en K classes Résultats SPSS : Somme des carrés intra-classes t i o n Part de somme des carrés totale expliquée par la typologie en K classes : (138 - Coeff[n-K])/138 C l u s C p e oa m x u s s f t s S s i t t c e t S e t t e e i a r e r 1 4 6 5 0 0 3 2 1 1 2 4 0 0 2 3 2 4 4 0 1 9 4 1 8 9 5 0 0 0 5 1 2 4 6 0 0 3 6 1 1 3 6 0 0 3 7 1 0 6 6 0 0 2 8 1 9 0 3 0 0 5 9 1 2 5 5 3 0 4 1 0 1 7 8 0 0 4 6 1 1 2 3 4 2 0 0 0 1 2 1 0 1 8 7 2 8 1 3 1 1 2 8 6 5 9 1 4 2 2 3 5 9 0 1 1 5 1 9 1 6 8 0 9 1 6 2 7 5 9 0 0 0 1 7 1 7 8 7 0 0 8 1 8 1 2 0 7 1 2 7 1 1 9 1 2 1 9 0 3 5 3 2 0 1 2 7 3 5 6 1 2 2 1 1 2 2 0 3 4 8 2 2 2 2 2 2 7 1 1 0 3 2 3 2 1 2 0 9 2 0 Part de somme des carrés totale expliquée par la typologie en 2 classes : (138 - 67.344)/138 = 0.512 Somme des carrés intra-classes pour la typologie en K=2 classes Somme des carrés totale = p*(n-1) 14 Distance de Ward(4,6) Premier plan principal et typologie 2 Peugeot 205 rallye BMW 325ix Citroën AX sport Audi 90 quattro BMW 530i Rover 827i Renault 25 Seat Ibiza sxi 1 Peugeot 205 Honda Civic Peugeot 405 Break Fiat Uno Ford Scorpio Renault 19 Citroën BX 0 Fiat Tipo Peugeot 405Ford Sierra Renault 21 Opel Omega Renault Espace Ford Fiesta -1 Ward Method Facteur 2 Nissan Vanette -2 3 VW Caravelle 2 -3 1 -2.0 15 -1.5 Facteur 1 -1.0 -.5 0.0 .5 1.0 1.5 2.0 16 Interprétation des classes p M M o 1 2 3 t C 7 7 0 2 P 9 8 3 7 V 1 5 0 8 P 1 3 3 3 L 9 5 7 8 L 7 6 7 3 17 Interprétation des classes 3 VW Caravelle 2 BMW 530i 1 CYLINDREE* 0 PUISSANCE* Fiat Tipo VITESSE* -1 VW Caravelle Nissan Vanette -2 POIDS* Citroën AX sport LONGUEUR* -3 LARGEUR* N= 7 7 7 7 1 18 Ward Method 7 7 11 11 11 11 11 11 2 6 6 6 6 3 6 6
Documents pareils
Classification Ascendante Hiérarchique
Rover 827i
Renault 25
Opel Omega
P
Peugeot
t 405 Break
B
k
Ford Sierra
BMW 325ix
Audi 90 Quattro
Ford Scorpio
Renault Espace
Nissan Vanette
VW Caravelle
Ford Fiesta
Fiat Uno
Peugeot 205
Peugeot
g
2...