the working paper
Transcription
the working paper
GREQAM Groupement de Recherche en Economie Quantitative d'Aix-Marseille - UMR-CNRS 6579 Ecole des Hautes Etudes en Sciences Sociales Universités d'Aix-Marseille II et III Alexandre Steyer GÉOMÉTRIE DE L’INTERACTION SOCIALE ET MODÈLES DE DIFFUSION DES INNOVATIONS Document de Travail n°03A25 GEOMETRIE DE L’INTERACTION SOCIALE ET MODELES DE DIFUSION DES INNOVATIONS. Alexandre Steyer - Professeur en Sciences de Gestion Université de Paris I, Panthéon-Sorbonne Résumé : Un nouveau modèle de diffusion des innovations est construit au confluent des travaux de Bass (1969) sur la diffusion aléatoire et de ceux de Hägerstrand sur la diffusion spatiale. Le modèle repose sur une structure particulière du réseau social au travers duquel se propage le mimétisme. Cette structure, à la fois aléatoire et régulière est un ‘petit monde’ au sens défini par Watts et Strogatz. Le modèle obtenu est validé empiriquement en ajustement et en prévision à partir de données empruntées à Hägerstrand, Bass et Rogers. A new model of diffusion is proposed at the bridge of Bass work on random diffusion and Hägerstrand work on spatial diffusion. A special structure underlying the social network is supposed to describe the diffusion process. This structure which both share spatial and random features is a ‘small world’ as defined by Watts and Strogatz. The model is successfully tested both in ajustement and forcasting ability on data from Hägerstrand, Bass and Rogers. Mots-clef : diffusion des innovations, diffusion spatiale, petits mondes JEL : C59 C32 M30 Introduction : La prévision des ventes de nouveaux produit reste un domaine dont les enjeux sont majeurs sur le plan économique. Depuis plus de trois décennies, le modèle de Bass est largement utilisé dans le champ de la modélisation de la diffusion des innovations. Il a généré d’autres modèles qui en sont des généralisations (Ouardighi et Tapiero 1997), soit par augmentation du nombre de paramètres (par exemple le modèle NUI de Easingwood, Mahajan et Muller, 1983), soit par augmentation du nombre de variables explicatives, comme le prix ou la publicité (Bass, Krishnan et Jain, 1994, par exemple). Cependant, les prévisions de ventes de nouveaux produits demeurent délicates (Parker 1994). Les modèles de diffusion reposent principalement sur le mimétisme et plus généralement sur toutes formes d'interaction sociale. La prise en compte de l'interaction ne peut se faire sans le recours à une hypothèse sur la structure du réseau social qui lui sert de support. Cette hypothèse n'est que très rarement explicitée (De Palma, Droesbeke et Lefèvre, 1991). Le modèle de Bass fait l'hypothèse implicite que la structure du réseau est aléatoire, comme cela sera explicité dans la première partie de cet article. Note objectif est de montrer comment les modèles de diffusion peuvent être améliorés en faisant des hypothèses plus réalistes sur la structure des réseaux sociaux. L’infini diversité de ces réseaux conduit à l’obligation de proposer une contrainte et une restriction. La contrainte vise à respecter un des avantages du modèle originel de Bass, à savoir sa simplicité. Il ne comporte que trois paramètres et le temps constitue l’unique variable explicative des ventes. L'ajout de paramètres ou de variables supplémentaires améliore souvent l'ajustement, au détriment de la simplicité et de la robustesse du modèle. Pour des raisons de parcimonie, nous contraindrons tous les modèles utilisés ou crées dans cette recherche à ne comporter qu'au plus trois paramètres. Les qualités d'ajustement pourront, de ce fait, être comparées dans les mêmes conditions. Les structures possibles du réseau social sont a priori en nombre infini. Dans cette première recherche, nous nous limiterons à des structures d'interaction sociale définies par le rôle central qu'y joue la dimension spatiale. Nous nous intéresserons seulement au cas où les individus ont d'autant plus de chance d'interagir qu'ils sont proches géométriquement. La deuxième partie de l'article décrira ce type de structure et montrera comment une loi de Weibull particulière permet de modéliser la diffusion géographique qui découle de cette structure sociale. Trois jeux de données complémentaires sont ensuite choisis avec soin pour comparer le modèle de Bass à ce modèle géographique. Les estimations effectuées nous permettront de conclure que la diffusion purement géographique, au sens d'Hägerstrand (1952), est correctement prise en compte par notre loi de Weibull particulière. Les autres cas étudiés voient le modèle de Bass l'emporter en qualité d'ajustement. La réflexion que susciteront ces résultats sur les mérites des structures aléatoires d'une part, et spatiales, d'autre part nous conduira naturellement à l'utilisation d'une structure introduite par Watts et Strogatz (1998) appelée ‘petit monde’. Celle-ci nous permet de combiner dans un même modèle une structure aléatoire et une structure spatiale. Le modèle en avalanches spatiales que nous obtenons et qui ne comporte que trois paramètres, s'avère meilleur que le modèle de Bass. Les limitations et les perspectives ouvertes par ce modèle nous permettront de conclure. 1) Diffusion sur une structure aléatoire. Considérons un réseau d’interaction sociale composé de N individus. Parmi eux, à l’instant t, n(t) ont adopté l’innovation. Ces individus vont interagir avec les N-n non encore adopteurs par imitation directe. Pour des raisons de clarté, nous supposons, dans cette section uniquement, que le temps nécessaire à une interaction directe entre deux individus est exactement égale à une unité de temps. En d’autres termes, chaque nouvel adopteur au temps t va être imité par d’autres individus exactement à l’instant t+1. La probabilité pour que deux individus pris au hasard puissent interagir directement est notée b/N. Un individu est donc, en moyenne, en interaction potentielle avec b autres individus. Nous définissons une triade comme un ensemble de trois individus quelconques A, B et C. Si A connaît B et C, la probabilité pour que B et C se connaissent aussi est noté σ. Cette quantité est parfois appelée ‘fraction de triplets transitifs’ par les sociologues (Wasserman et Faust 1994). Dans le cas où le graphe des relations sociales serait purement aléatoire, le fait que A interagisse avec B et C ne change rien aux chances qu’ont B et C d’interagir. Il n’y a aucune corrélation et, par conséquent, σ = b/N. La cinétique chimique fournit une bonne image de ce réseau aléatoire. En effet, les molécules se déplacent au hasard dans l’espace. Elles se rencontrent lors de chocs aléatoires, sans mémoire et se transforment alors mutuellement en produits. De même, dans le cadre d’un réseau social aléatoire, à chaque instant t, la probabilité, par unité de temps, de rencontrer un adopteur susceptible d’exercer son influence est une constante σ = b/N. La probabilité d’adopter par unité de temps est donc σ n. Cette hypothèse conduit à poser l’équation différentielle: dn dt = b n (1) N −n N Cette équation n’est autre que le modèle logistique. Son principal inconvénient est de ne pas satisfaire à la contrainte n(0)=0 d’un nombre d’adopteur initial nul. Ceci provient du fait que, pour pouvoir démarrer, le processus d’interaction a besoin d’un nombre d’individus initiaux non nul. Bass a proposé une modification simple de ce modèle en 1969 qui contourne le problème en introduisant un terme d’innovation dont le modèle s’écrit: dn n = (a + b ) ( N − n) dt N , (2) dont la solution est : f (t ) = n(t ) e( a+ b) t − 1 = ( a+ b) t b N e + . (3) a Notons que durant la phase de croissance pendant laquelle n est très petit devant N, on trouve, une croissance exponentielle du nombre d'adopteurs. A partir de la phase de croissance, moment où l’interaction sociale joue pleinement son rôle, les modèles logistiques et le modèle de Bass sont équivalents. La structure aléatoire du réseau social favorise la diffusion comme le montre la croissance très rapide, car exponentielle, du nombre d’adopteur. Cette rapidité est liée à deux propriétés fondamentales du réseau aléatoire. La première est que, dans ce type de réseau, deux individus pris au hasard peuvent être reliés l’un à l’autre par un petit nombre d’individus intermédiaires. Les réseaux sociaux possèdent effectivement cette propriété comme l’a montré Milgram dans ses fameuses expériences (Kochen 1989). Celles-ci ont montré que pour trouver un individu pris au hasard aux Etats-Unis, un américain n’a besoin de passer que par six individus intermédiaires en moyenne. Il en résulte que la contagion va se faire rapidement car la distance sociale à parcourir est faible. La seconde propriété est que les phénomènes de saturation n’ont pas lieu durant la phase de croissance. Des saturations peuvent en effet avoir lieu si σ n’est pas petit comme nous allons maintenant le décrire. Examinons d’abord le cas extrême σ=1, c’est-à-dire un réseau social totalement transitif. L’adage « les amis de mes amis sont amis » est alors ici à prendre au sens strict. Cette structure de l’interaction est en fait incompatible avec le phénomène de diffusion. En effet, si A adopte le nouveau produit à t=0, il entraîne, à t=1, b individus Bi à l’adoption. Tous les Bi connaissent A. D’après le principe de transitivité, tous les individus adoptant à t=3 sous l’influence des individus Bi connaîtront aussi A et de ce fait, ils auront déjà adopté en t=2 ! La diffusion n’a donc plus lieu à partir de t=3. Examinons le cas où σ n’étant pas égal à 1, il n’en demeure pas moins non négligeable. Si A adopte le nouveau produit à t=0, il entraîne, à t=1, b individus Bi à adopter. Tous les Bi connaissent A. On est donc en présence de k(k-1)/2 triades susceptibles d’être transitives avec une probabilité σ. Lorsqu’une triade est transitive, elle ampute de deux le potentiel de personnes influençables par les Bi. Par conséquent, le nombre d’individus C i n’est que de k(k-1)σ. La croissance est donc moins rapide que dans le cas du réseau aléatoire. De même, une fraction des Ci se connaissent, ce qui réduit d’autant leur potentiel d’influence. A ce stade, les calculs probabilistes deviennent trop complexes pour pouvoir être menés dans le cas général. Il devient nécessaire de disposer de toute la structure du réseau pour réaliser une prévision de diffusion. Cette approche est possible sur des réseaux de taille raisonnable et elle s’est avérée très féconde (Valente 1995). Mais elle n’est pas envisageable à l’échelle de l’ensemble d’un marché du type de celui qui nous préoccupe. Si σ est très petit, aucune saturation dans les cercles d’influence directe de chaque individu ne se fait sentir durant la phase de croissance qui reste donc exponentielle. Le réseau aléatoire entre dans cette catégorie car σ=b/N tend vers 0 pour les grands N, chaque individu ne connaissant qu’une petite fraction de l’ensemble des consommateurs qui constituent le marché. Ces deux propriétés d’absence de saturation dans le voisinage des individus et de faible nombre d’intermédiaires entre les individus font du réseau aléatoire un support très efficace de la diffusion des innovations. Cette efficacité ne doit cependant pas faire perdre de vue l’irréalisme de la structure aléatoire. Si le faible nombre d’intermédiaires est confirmé empiriquement par les travaux psychosociologiques déjà cités, il n’en est pas du tout de même pour la faible valeur du facteur de transitivité σ. Par exemple, en étudiant le réseau social de 225 226 acteurs de cinéma (un acteur est supposé être en relation avec un autre s’ils ont joué ensemble dans au moins un film), Watts et Strogatz (1998) ont obtenu un nombre moyen de 3,65 intermédiaires pour établir une relation indirecte entre deux acteurs pris au hasard. Cette valeur très faible milite en faveur d’un réseau aléatoire. Par contre, ils ont mesuré σ = 0,8 ce qui n’est pas compatible avec un réseau aléatoire. En effet, chaque acteur a joué en moyenne avec 61 autres. Pour un réseau aléatoire, nous aurions donc observé σ = 61/225226 = 0,00027 qui est bien inférieur à la valeur mesurée. Cette étude montre donc que, au moins dans une certaine mesure, et en conformité avec l’intuition, ‘les amis de nos amis sont nos amis’. Des corrélations sont donc induites dans la structure du réseau qui cesse d’être aléatoire. L’origine de ces corrélations est multiple. L’une d’elle est le principe d’homophilie qui pousse les individus à se regrouper entre personne de classe socioculturelle équivalente. Dans cette recherche, nous étudions une autre variable qui peut expliquer, dans certains cas, la présence de ces corrélations, à savoir la distance géométrique. En effet, si l’effet de voisinage explique la présence d’interactions entre les individus, le réseau qui en résulte est grandement transitif car la distance géométrique l’est aussi. Si A est voisin de B et C, alors ces derniers le sont probablement aussi. Ceci nous conduit à la deuxième structure de réseau social envisagé : la structure spatiale. 2) Diffusion spatiale des innovations. Les géographes ont montré depuis les travaux fondateurs de Hägerstrand (1952) que les individus interagissent d’autant plus facilement qu’ils vivent dans des lieux proches. En conséquence, lorsqu’un individu adopte un nouveau produit, les nouveaux adopteurs qu’il va induire se trouve dans son entourage. Ce phénomène à été mis en évidence par Whyte (1954). Des photographies aériennes de la banlieue de Philadelphie ont permis à l’auteur de repérer les maisons équipées de climatiseurs. Celles-ci n’étaient pas distribuées au hasard, mais présentaient des agrégats. Ainsi, l’influence des voisins les uns sur les autres a été prouvée. Notons que l’explication du phénomène par des variables exclusivement individuelles mais corrélées à l’espace par le type d’habitation et de quartier (CSP, age, type de foyer…) était exclue grâce à la grande homogénéité socioprofessionnelle de ces quartiers. Le concept fondamental de la diffusion géographique est la notion de front de diffusion (Hägerstrand 1952). Ce front représente les lignes de séparation entre les zones où les individus ont adopté l’innovation et celles ou ils ne l’ont pas encore fait. Ce front avance au cours du temps à la manière d’un mascaret à partir des lieux pionniers dans l’adoption de l’innovation. Un bon exemple de diffusion géographique à l’échelle de la France est celui de la diffusion du maïs dans la période d’après guerre à propos de laquelle Mendras (1970) écrit « En 1959, alors que le maïs hybride avait été introduit depuis 10 ans dans la vallée de Nay, 19 agriculteurs sur 100 ne cultivaient pas de maïs hybride et 36 en cultivaient moins d’un hectare. Le maïs hybride, venu d’Amérique, avait été introduit dans le sud-ouest après la libération […] les conversations avec les agriculteurs et l’observation des champs des voisins ont naturellement beaucoup plus d’importance à mesure que la culture se répands, on voit des champs d’hybrides un peu partout et que les conversations à ce sujet deviennent plus fréquentes. La tentative des pionniers a mis plusieurs années à faire tâche d’huile et à convaincre les autres. » La modélisation quantitative de cette diffusion spatiale a fait l’objet de trop peu de recherches en marketing, contrairement à ce que l’on observe en géographie. On citera les travaux de Mahajan V. et Peterson R. (1979) et de A. Cliff et Ord (1975). Ces auteurs ont étudié la diffusion spatiale des tracteurs dans les régions centrales des Etats-Unis. Leur modélisation permet en particulier d’estimer un coefficient d’interaction sociale entre des régions prédéfinies. On attend d’une manière générale que ce coefficient soit d’autant plus petit qu’il concerne des régions plus éloignées l’une de l’autre. Une autre possibilité est de le faire dépendre, dans le cas d’un nouveau produit de télécommunication, de la quantité d’échanges téléphoniques entre les deux régions (Steyer A. Et Zimmermann J. B. 1996) . Notre recherche ne porte pas sur l’analyse spatiale du phénomène de diffusion mais sur le lien entre l’évolution temporelle de la diffusion et la structure géographique qui lui sert de support. Nous ne disposons cependant pas de données spatiales exhaustives. De ce fait, nous restreindrons notre analyse à des modèles dans lesquels l’espace et les individus sont supposés homogènes. Cela exclut en conséquence une partie des résultats obtenus par les géographes qui ont montré comment la hiérarchie des villes (induite par leurs tailles et leurs proximités) structurait la diffusion qui se fait alors des villes les plus centrales vers les villes les plus périphériques (Brown et Cox 1971). Une autre conséquence de notre hypothèse d’homogénéité de l’espace est que la vitesse du front de diffusion est constante durant la phase de croissance. Ceci est raisonnable dans la mesure ou le temps mis par le front de diffusion pour avancer d’un individu à l’autre est égal au temps mis par un individu pour parvenir à influencer un de ses pairs. C’est donc une constante si les individus et l’espace sont homogènes. A un instant donné, les zones géographiques occupées par des adopteurs sont des agrégats ou encore des « tâches d’huile », dont les frontières sont le front de diffusion. Ces tâches grossissent à mesure que leurs frontières avancent à vitesse constante. Leur rayon augmente donc linéairement avec le temps. Le nombre de nouveaux adopteurs est à chaque instant proportionnel à l’augmentation de la surface des tâches. Il est donc aussi proportionnel au rayon moyen des tâches. Ce rayon peut être exprimé en fonction de deux quantités différentes. D’une part, le front de diffusion avançant à vitesse constante, le rayon des tâches doit augmenter linéairement avec le temps. De ce fait, le nombre de nouveaux adopteurs est dn lui aussi une fonction linéaire du temps, soit = b t. dt D’autre part la surface des tâches est proportionnelle au carré de leur rayon. La surface étant proportionnelle au nombre d’adopteurs, on en déduit que le rayon est proportionnel à la racine dn de n. Le nombre de nouveaux adopteurs s’exprime donc aussi comme = b' n . dt Si on multiplie le nombre de nouveau adopteurs par N-n pour faire intervenir le phénomène de saturation, on obtient donc deux modèles de diffusion géographique : dn = b t ( N − n) , (4a) dt dn = b' n ( N − n) . dt (4b) Le premier modèle (4a) est un cas particulier du modèle de dont la solution est une des lois de Weibull 2 n(t ) f (t ) = = 1− e − b t (5a) N ( ) Remarquons que ce modèle ne comporte que deux paramètres, soit un de moins que le modèle de Bass. Notons que la loi de Weibull proposé par Sharif et Islam (1980) comme courbe de diffusion n’avait pas jusqu’ici reçu d’interprétation en terme d’interaction sociale. L’autre modèle est un cas particulier de courbe logistique non symétrique de Easingwood, Mahajan et Muller (1981). Ceci est aussi un cas particulier du modèle d’influence non uniforme Easingwood, Mahajan et Muller (1983). La solution de (4b) est : 2 n(t ) e b' t −1 = b' t . f (t ) = (5b) N e +1 Nous disposons donc de deux modèles de diffusion géographique. Ces deux modèles sont équivalents durant la phase de croissance parabolique pendant laquelle on a n ≈ N b t 2 . 3) Sélection des jeux de données pour l’analyse empirique. Nous avons testé la pertinence des courbes de diffusion (5a) et (5b) sur un ensemble de données empiriques, et comparé les résultats avec ceux obtenus avec le modèle de Bass (3). Les données ont été choisies car elles sont issues de travaux de recherche mettant en évidence une forte composante géographique dans la diffusion de l’innovation concernée. Les modèles que nous proposons ne sont en effet valables que pour des diffusions pour lesquelles le caractère géographique est central. Nous allons donc tester l’hypothèse d’une meilleure adéquation aux données des courbes de diffusion (5a) et (5b) par rapport à la courbe de diffusion de Bass (3). La comparaison doit cependant être nuancée car le modèle de Bass comporte un paramètre de plus que les modèles géographiques. Les deux modèles n’étant pas emboîtés, l’estimation par maximum de vraisemblance ne peut nous aider dans la comparaison des deux modèles. Nous nous contenterons donc des écarts quadratiques moyens. Trois jeux de données ont été examinés. Le premier est un retour aux sources puisqu’il s’agit des données utilisées par Hagerstrand lui-même dans son étude fondatrice sur la diffusion spatiale des innovations. Ce jeu de donné nous assure donc de disposer d’un cas pour lequel la dimension géographique de la diffusion est non seulement prouvée mais aussi parfaitement centrale dans l’explication de l’évolution temporelle du nombre d’adopteurs. L’innovation considérée par Hägerstrand est une subvention octroyée par le gouvernement suédois à partir de 1928 aux petites exploitations agricoles en échange de la conversion de surfaces boisées en herbage. L’auteur fournit le nombre de nouvelles subventions annuelles entre 1928 et 1944 pour la région étudiée (Östergötaland, Suède). La figure 1 reproduit ces données. Le deuxième jeu de données est une des innovations utilisée par Bass (1969) pour fonder son modèle, à savoir la diffusion des climatiseurs d’air aux Etats-Unis. Celle-ci a été choisie parmi les autres car c’est la seule pour laquelle une étude empirique a montré sans ambiguïté l’importance du voisinage géographique dans la diffusion (Whyte 1954). Par ailleurs Easingwood, Mahajan et Muller (1983) ont appliqué le modèle d’influence non uniforme sur ces données et ont obtenu l’équation de diffusion suivante : 0 , 4954 dn n = 0,000168 + 0,2013 (22389 − n) dt 22389 Or, on peut remarquer que le coefficient d’innovation 0,000168 est très petit et que l’exposant d’influence 0,4954 est très proche de 1/2. Les valeurs empiriques des paramètres de ce modèle le rendent donc très proche du modèle géographique [5b]. Ces deux arguments font de la diffusion des climatiseurs un très bon candidat de diffusion géographique. Néanmoins la dimension spatiale n’est pas la seule explication de la diffusion. D’autres variables comme le prix ou la publicité peuvent influencer la diffusion, et donc les qualités d’ajustement du modèle. Pour cette raison nous avons construit un troisième jeu de données de diffusion virtuelle sur un réseau social réel dans lequel seule la structure de l’interaction entre les individus explique la diffusion. La pertinence par rapport à notre thème de recherche impose cependant que cette interaction possède une dimension spatiale importante. C’est pour cette raison que nous avons utilisé le sociogramme publié par Rogers (1995) page 302 concernant les habitants d’un quartier dont les relations de voisinage sont en partie structurées par le lieu d’habitation. Rogers qui avait pour objectif d’étudier la diffusion d’équipement en énergie solaire observe lui aussi des agrégats et écrit à leur sujet : «such agrégats occur because the nearby neighbors of an initial adopter are influenced to adopt ». Les 44 individus qui composent ce sociogramme sont en moyenne en relation avec 2,6 voisins chaque semaine (niveau de fréquence minimum choisi pour définir la relation sociale). Si le réseau était aléatoire, nous devrions mesurer pour σ une valeur de 2,6/44 = 0,06. Au lieu de cela, nous avons mesuré σ = 0,33. L’effet de voisinage est donc particulièrement important dans ce sociogramme qui par conséquent un bon candidat pour une modélisation spatiale des interactions. Pour construire la courbe de diffusion correspondant à ce réseau social, nous partons d’un seul adopteur initial, l’innovateur. Au temps suivant, tous les habitants avec lesquels il déclare parler au moins une fois par semaine sont supposés être de nouveaux adopteurs. Nous continuons ainsi de proche en proche : chaque nouvel adopteurs induit tous les habitants avec qui il discute au moins une fois par semaine à adopter au temps suivant. Cette diffusion virtuelle est réalisée pour chaque individu non isolé. La courbe de diffusion utilisée est la somme de toutes les courbes de diffusions virtuelles. La courbe résultante est illustrée en figure 2. 4) Résultats empiriques des quatre modèles. Munis de ces trois jeux de données, nous avons procédé à des estimations en utilisant la régression non linéaire dans la formulation proposée par Jain et Rao (1990). Ainsi, si le nombre de nouveaux adopteurs observé est v(t) et si leur nombre total est n(t) à chacun des T instants t, on pose v(t) = N − n(t ) ( f (t ) − f (t − 1) ) + ε t 1 − f (t ) où les ε t sont T résidus. Un algorithme classique de gradient conjugué nous permet de 1 ε t2 en faisant varier les paramètres. L’écart quadratique moyen trouver le minimum de ∑ T t 1 est la valeur du minimum de ∑ ε t2 obtenu. Ces écarts sont consignés dans le tableau 1. T t Les résultats concernant les données de Hagerstrand sont conformes aux hypothèses. Les modèles géographiques sont meilleurs que le modèle de Bass. Ils s’adaptent mieux aux données de Hägerstrand alors qu’ils sont moins flexibles que le modèle de Bass qui comporte un paramètre de plus. Cette situation confirme l’intérêt des modèles géographiques pour ce cas d’innovation directement lié à la géographie (domaine agricole). On constate que le modèle (5a) est systématiquement meilleur que le modèle (5b). Ce dernier ne sera donc plus considéré dans la suite de notre recherche. Concernant les autres données, le modèle de diffusion géographique ne souffre pas la comparaison. Ceci est particulièrement gênant pour la diffusion sur le sociogramme de Rogers. Sa nature même impose en effet une dimension spatiale sous-jacente et sa valeur de σ montre qu’il est beaucoup plus transitif qu’un réseau aléatoire. Pourtant le modèle aléatoire de Bass est plus performant. Ceci nous conduit à remettre en question le modèle géographique et à en créer un autre dans la section suivante. 5) Modèles des avalanches spatiales La courbe de diffusion est le reflet direct de la géométrie de l’interaction sociale. Or le modèle de diffusion géographique fait l’hypothèse que l’ensemble des interactions entre individus se fait d’un voisin à un autre dans un plan euclidien. Cette exclusivité spatiale des interactions aboutit à un modèle trop restreint pour s’ajuster aux données, sauf dans le cas d’une diffusion purement géographique. Une extension du modèle géographique consiste à lui ajouter la possibilité d’autres types d’interactions. Nous proposons donc un nouveau modèle de diffusion que nous appelons modèle de diffusion en avalanche spatiale. La notion d’avalanche spatiale généralise la notion de tâche d’huile car elle peut s’étendre aussi bien dans l’espace qu’à travers un autre réseau. Nous avons vu dans la première partie de cet article que le réseau aléatoire présentait l’avantage de ne demander que quelques liens pour relier entre eux les individus (loi de Milgram) et ceci en conformité avec les mesures empiriques. La conséquence de cette propriété est la croissance exponentielle du nombre d’adopteurs. Le réseau purement spatial que nous avons ensuite envisagé présente la propriété réaliste de transitivité mesurée par des valeurs élevées de σ. La conséquence de cette transitivité induite par l’effet de voisinage est une croissance parabolique du nombre de nouveaux adopteurs. Ces deux propriétés, transitivité et faible nombre d’intermédiaires, étaient considérées comme antinomiques jusqu’aux travaux de Watts et Strogatz (1998) qui ont décrit des réseaux où elles coexistent. Ces réseaux appelés ‘petits mondes’ sont une superposition de structures régulière et aléatoire. L’une d’entre elle retient toute notre attention car elle suppose les individus positionnés sur un plan euclidien entretenant des relations soit avec leurs voisins les plus proches (réseau régulier) soit d’autres individus choisis au hasard (réseau aléatoire). Cette structure va nous permettre de conserver les avantages de la diffusion aléatoire et de la diffusion géographique. Le modèle que nous allons établir sera intermédiaire entre les croissances parabolique et exponentielle et son ajustement devrait être supérieur à la fois au modèle de Bass et au modèle géographique. Dans le modèle d’avalanche spatiale les tâches d’huile s’étendent comme dans le modèle géographique mais les individus atteints par le front de diffusion sont susceptibles de donner eux-même naissance, via le réseau aléatoire, à de nouvelles tâches en d’autres lieux. Dans un premier temps, nous modélisons la phase de croissance. Il sera ensuite facile de modéliser l’ensemble de la courbe de diffusion par la multiplication des ventes par N-n afin de prendre en compte l’effet de saturation du marché comme cela a été fait précédemment. Si dn n(t) désigne toujours le nombre total d’adopteurs, est le nombre de nouveaux adopteurs. dt Ceux-ci peuvent provenir soit de la propagation du front de diffusion de la première tâche d’huile, soit d’une tâche née au temps τ, τ pouvant être quelconque entre 0 et t. Dans le dn premier cas, on a conformément à (4) = b t . Dans le deuxième cas, si la tâche d’huile dt secondaire est née à t= τ, deux phénomènes ont eu lieu. Le premier est la naissance de la tâche, le second est sa propagation. Une tâche a d’autant plus de chance de naître à l’instant τ qu’il y a de nouveaux adopteurs à cet instant. Soit α la probabilité de donner naissance à une nouvelle tâche par un nouvel adopteur. Une fois née, cette tache a un temps t- τ pour se propager jusqu’à l’instant t. Le bilan global peut donc s’écrire : dn =bt +α dt ∫ t 0 dn(τ ) b (t − τ ) dτ dτ (6) En effectuant une intégration par partie (avec n(0)=0) on obtient : t dn = b t + α b ∫ n(τ ) dτ 0 dt Une dérivation de cette équation suivie d’une multiplication par dn conduit à dt dn dn d 2 n dn = b + α b n(t ) 2 dt dt dt dt dont l’intégration et la multiplication par le terme de saturation N-n donne l’expression des nouveaux adopteurs: dn = dt 2b n + α b n 2 ( N − n ) La solution de ce modèle d’avalanches spatiales est : f (t ) = ( ) ch t b(2 + α ) − 1 n(t ) = N ch t b(2 + α ) + α + 1 ( ) (7) Comme celui de Bass, ce modèle comporte trois paramètres. Il lui est très proche puisque qu’il suffit de changer les exponentielles en cosinus hyperbolique dans (3) pour trouver (7). Aux temps longs, les deux modèles sont donc équivalents. Cependant au début de la phase de croissance, au moment où la diffusion des tâches régule la dynamique de la diffusion, ce modèle se comporte comme un modèle géographique avec une croissance parabolique. C’est donc bien un modèle intermédiaire entre les modèles de Bass et géographique. 6) Performances du modèle en avalanches spatiales. Notre modèle a été testé sur les trois jeux de données dans les mêmes conditions que celui de Bass. Si les données très imprégnées de dimensions géographiques pures de Hägenstrand ne bénéficient pas d’une amélioration de l’ajustement par les avalanches spatiales, la situation est toute autre pour les climatiseurs. Le gain par rapport aux modèles géographique est en effet important (20%) et ceci à nombre de paramètre identique. La diffusion des climatiseurs est donc mieux prise en compte par notre modèle. Cette amélioration de l’ajustement provient vraisemblablement d’une meilleure prise en compte de la structure de l’interaction puisque la diffusion simulée sur le sociogramme de Rogers bénéficie d’une amélioration encore plus importante (60%) quand on utilise le modèle des avalanches spatiales plutôt que celui de Bass. Notre objectif est donc atteint puisque nous disposons d’un modèle de diffusion à trois paramètres basé sur une géométrie de l’interaction différente de celle de Bass et dont les performances en ajustement sont meilleures. Dans le but d’applications nous devons également valider les capacités prédictives de ce modèle comparées à celui de Bass. Nous reprenons pour ce faire la même démarche que ce dernier, basée sur la prévision a posteriori, dans son article de 1969. Pour chaque année postérieure au point d’inflexion de la courbe de diffusion empirique, les modèles sont estimés et une prévision en est déduite pour l’année suivante. L’écart quadratique moyen entre les prévisions et le nombre réel de nouveaux adopteurs est alors calculé comme indicateur de la performance prédictive des deux modèles. Les valeurs obtenues sont consignées dans le tableau 2. Elles confirment la supériorité du modèle des avalanches spatiales. 7) Conclusion Nous avons construit un modèle de diffusion temporel dans la lignée des travaux sur la diffusion spatiale de Hägerstrand. Ce modèle a été validé sur les données géographiques de Hägerstrand mais pas sur des données du champ du marketing choisies en raison du rôle prouvé de la dimension spatiale dans la diffusion qu’elles mesurent. Paradoxalement, le modèle de Bass qui néglige toute corrélation dans la structure sociale est meilleur en ajustement dans ce cas. Ce constat nous a conduit à proposer un nouveau modèle d’avalanches spatiales qui sont susceptibles de se propager tant par effet de voisinage que par interactions aléatoires. La structure du réseau social qui sous-tend ce nouveau modèle est appelée ‘petit monde’. Elle s’est déjà avérée utile dans la modélisation des réseaux sociaux. Ce nouveau modèle s’est alors montré supérieur au modèle de Bass tant en ajustement qu’en prévision. Certaines limitations doivent cependant être notées. Les résultats ont été obtenus sur trois jeux de données seulement. Il convient donc, comme pour tout modèle, de l’éprouver sur un plus grand nombre de cas pour lesquels la dimension géographique est pertinente. Le modèle que nous avons construit ne prétend à aucune universalité. Si ses performances sont clairement supérieures à celles du modèle de Bass, ce n’est que dans un contexte bien particulier où la dimension spatiale joue un rôle important dans le phénomène de diffusion. Les perspectives ouvertes par ce travail ne concernent pas seulement la diffusion géographique. Il est en effet possible d’améliorer notre modèle par exemple en introduisant un effet de hiérarchie suivant la théorie des places centrales (Brown et Cox 1971), en plus de l’effet de voisinage, renonçant par-là même à l’hypothèse d’homogénéité de l’espace. La vitesse du front de diffusion pourrait aussi être supposée variable. Enfin, ce travail introduit une démarche générale à travers l’analyse du cas particulier de la diffusion spatiale. La démarche générale qui nous souhaitons voir se développer consiste à s’interroger sur le lien entre l’évolution temporelle du nombre d’adopteurs et la structure du réseau social sous-jacent à la diffusion et à travers lequel opère le processus d’influence interpersonnelle. Le nombre de structures étant sans limite, nous espérons qu’elles donneront lieu à de nombreux autres modèles de diffusion aux applications mieux ciblées et moins illusoirement universelles. BIBLIOGRAPHIE Bass F. M. (1969), A new product growth model for consumer durables, Management Science, 15, 215-227. Bass F. M., Krishnan T. V. et Jain D. C. (1994), Why the Bass model fits without decision variables, Marketing Science, vol. 13, n°3 p203-223. Brown L. A. et Cox K. R. (1971), Annals of the Association of American Geographer, 61, 551-559. Cestre G. (1996), Diffusion et innovativité : définition, modélisation et mesure, Recherche et Applications Marketing, 11, 1, 69-88. Cliff A. D. et Ord J. K. (1975) Space-time modelling with an application to regional forecasting, Institute of British Geographer, Publications, 64, 119-128. De Palma A., Droesbeke J-J. et Lefèvre C. (1991), Modèles de diffusion en marketing, PUF. Easingwood C. J., Mahajan V. et Muller E. (1981), A nonsymetric responding logistic model for forecasting technological substitution, Technological forecasting and social change, 20, 199-213. Easingwood C. J., Mahajan V. et Muller E. (1983), A non-uniform influence innovation diffusion model of new product acceptance, marketing science, 2, 273-296 traduit dans RAM vol 2, n°3, 1987. El Ouardighi F. et Tapiero C. S. (1997), Modèles de Diffusion en Marketing, RAM, vol 12, n°4, 15-40. Hägerstrand T. (1952), The propagation of innovation waves, Lund Studies in Geography. Hägerstrand T. (1967), Innovation diffusion as a spatial process, University of Chicago Press. Jain D. C. et Rao R. C. (1990), Effect of Price on the demand for durables: modeling, estimation and findings, Journal of Business and economic statistics, 8, 163-170. Kochen M (ed) (1989), The Small World, Ablex, Norwood, NJ. Mendras H. (1970), La fin des paysans, Paris. Mahajan V. et Peterson R. A. (1979) Integrating time and space in technological substitution models, Technological Forcasting and Social change, 14, 231-241. Parker P. M.(1994), Aggregate diffusion forecasting models in marketing: A critical Review, Int. Journ. of Forecasting, 10, 353-380. Rogers E. M. (1995), Diffusion of Innovations, The Free Press, New York Sharif M. N. et Islam M. N. (1980), the weibull distribution as a general model fo forecasting technological change, Technological forecasting and social change, 18, 247-256. Steyer A. Et Zimmermann J. B. (1996), Externalité de Réseau et Adoption d’un Standard dans une structure Résiliaire, Revue d’Economie Industrielle, 76, 67-90. Valente T. W. (1995), Netwok Models of the Diffusion of Innovations, Hampton Press. Wasserman S. et Faust K. (1994), Social Network Analysis : Methods ans Applications, Cambridge University Press. Watts D. J. et Strogatz S. (1998), Collective dynamics of small-world networks, Nature 393, 4 p 440-442. Whyte W. H. Jr (1954), The Web of Word of Mouth, Fortune, novembre 1954, 140-212. FIGURES Figure 1: Données de Hägerstrand nouvelles subventions 600 500 400 300 200 100 0 1925 1930 1935 1940 1945 année nouveaux adopteurs Figure 2: Simulation de diffusions sur sociogramme réel 300 250 200 150 100 50 0 0 2 4 6 temps 8 10 TABLEAUX Tableau 1 : Valeurs des écarts quadratiques moyens obtenus pour les différents modèles sur les trois jeux de données. Données Rogers (simulation) Bass (air climatisé) Hägerstrand Modèle de Bass [3] 19 23 816 7 431 Modèle géographique [5a] 1 003 38 791 5 772 Modèle géographique [5b] 1 600 40 348 5 946 Modèle d’avalanches spatiales 8 18 985 5 874 Tableau 2 : Erreur quadratiques moyennes de prévisions à un an pour les deux modèles à trois paramètres. Données Rogers (simulation) Bass (air climatisé) Erreur quadratique de prévision avec le modèle de Bass 124 121 227 Erreur quadratique de prévision avec le modèle d’avalanches spatiales 73 8 866 Nombre de pas de temps de prévision 4 5 !"#$%$&$$& $%'$&$()$ *%+,- ** & !"#!$%%& '() *+ , -./++01!/