the working paper

Transcription

the working paper
GREQAM
Groupement de Recherche en Economie
Quantitative d'Aix-Marseille - UMR-CNRS 6579
Ecole des Hautes Etudes en Sciences Sociales
Universités d'Aix-Marseille II et III
Alexandre Steyer
GÉOMÉTRIE DE L’INTERACTION
SOCIALE ET MODÈLES DE DIFFUSION
DES INNOVATIONS
Document de Travail
n°03A25
GEOMETRIE DE L’INTERACTION SOCIALE ET MODELES DE DIFUSION DES
INNOVATIONS.
Alexandre Steyer - Professeur en Sciences de Gestion
Université de Paris I, Panthéon-Sorbonne
Résumé :
Un nouveau modèle de diffusion des innovations est construit au confluent des travaux de
Bass (1969) sur la diffusion aléatoire et de ceux de Hägerstrand sur la diffusion spatiale. Le
modèle repose sur une structure particulière du réseau social au travers duquel se propage le
mimétisme. Cette structure, à la fois aléatoire et régulière est un ‘petit monde’ au sens défini
par Watts et Strogatz. Le modèle obtenu est validé empiriquement en ajustement et en
prévision à partir de données empruntées à Hägerstrand, Bass et Rogers.
A new model of diffusion is proposed at the bridge of Bass work on random diffusion and
Hägerstrand work on spatial diffusion. A special structure underlying the social network is
supposed to describe the diffusion process. This structure which both share spatial and
random features is a ‘small world’ as defined by Watts and Strogatz. The model is
successfully tested both in ajustement and forcasting ability on data from Hägerstrand, Bass
and Rogers.
Mots-clef : diffusion des innovations, diffusion spatiale, petits mondes
JEL : C59 C32 M30
Introduction :
La prévision des ventes de nouveaux produit reste un domaine dont les enjeux sont majeurs
sur le plan économique. Depuis plus de trois décennies, le modèle de Bass est largement
utilisé dans le champ de la modélisation de la diffusion des innovations. Il a généré d’autres
modèles qui en sont des généralisations (Ouardighi et Tapiero 1997), soit par augmentation du
nombre de paramètres (par exemple le modèle NUI de Easingwood, Mahajan et Muller,
1983), soit par augmentation du nombre de variables explicatives, comme le prix ou la
publicité (Bass, Krishnan et Jain, 1994, par exemple).
Cependant, les prévisions de ventes de nouveaux produits demeurent délicates (Parker 1994).
Les modèles de diffusion reposent principalement sur le mimétisme et plus généralement sur
toutes formes d'interaction sociale. La prise en compte de l'interaction ne peut se faire sans le
recours à une hypothèse sur la structure du réseau social qui lui sert de support. Cette
hypothèse n'est que très rarement explicitée (De Palma, Droesbeke et Lefèvre, 1991). Le
modèle de Bass fait l'hypothèse implicite que la structure du réseau est aléatoire, comme cela
sera explicité dans la première partie de cet article.
Note objectif est de montrer comment les modèles de diffusion peuvent être améliorés en
faisant des hypothèses plus réalistes sur la structure des réseaux sociaux. L’infini diversité de
ces réseaux conduit à l’obligation de proposer une contrainte et une restriction.
La contrainte vise à respecter un des avantages du modèle originel de Bass, à savoir sa
simplicité. Il ne comporte que trois paramètres et le temps constitue l’unique variable
explicative des ventes. L'ajout de paramètres ou de variables supplémentaires améliore
souvent l'ajustement, au détriment de la simplicité et de la robustesse du modèle. Pour des
raisons de parcimonie, nous contraindrons tous les modèles utilisés ou crées dans cette
recherche à ne comporter qu'au plus trois paramètres. Les qualités d'ajustement pourront, de
ce fait, être comparées dans les mêmes conditions.
Les structures possibles du réseau social sont a priori en nombre infini. Dans cette première
recherche, nous nous limiterons à des structures d'interaction sociale définies par le rôle
central qu'y joue la dimension spatiale. Nous nous intéresserons seulement au cas où les
individus ont d'autant plus de chance d'interagir qu'ils sont proches géométriquement. La
deuxième partie de l'article décrira ce type de structure et montrera comment une loi de
Weibull particulière permet de modéliser la diffusion géographique qui découle de cette
structure sociale. Trois jeux de données complémentaires sont ensuite choisis avec soin pour
comparer le modèle de Bass à ce modèle géographique. Les estimations effectuées nous
permettront de conclure que la diffusion purement géographique, au sens d'Hägerstrand
(1952), est correctement prise en compte par notre loi de Weibull particulière. Les autres cas
étudiés voient le modèle de Bass l'emporter en qualité d'ajustement. La réflexion que
susciteront ces résultats sur les mérites des structures aléatoires d'une part, et spatiales, d'autre
part nous conduira naturellement à l'utilisation d'une structure introduite par Watts et Strogatz
(1998) appelée ‘petit monde’. Celle-ci nous permet de combiner dans un même modèle une
structure aléatoire et une structure spatiale. Le modèle en avalanches spatiales que nous
obtenons et qui ne comporte que trois paramètres, s'avère meilleur que le modèle de Bass. Les
limitations et les perspectives ouvertes par ce modèle nous permettront de conclure.
1) Diffusion sur une structure aléatoire.
Considérons un réseau d’interaction sociale composé de N individus. Parmi eux, à l’instant t,
n(t) ont adopté l’innovation. Ces individus vont interagir avec les N-n non encore adopteurs
par imitation directe. Pour des raisons de clarté, nous supposons, dans cette section
uniquement, que le temps nécessaire à une interaction directe entre deux individus est
exactement égale à une unité de temps. En d’autres termes, chaque nouvel adopteur au temps t
va être imité par d’autres individus exactement à l’instant t+1.
La probabilité pour que deux individus pris au hasard puissent interagir directement est notée
b/N. Un individu est donc, en moyenne, en interaction potentielle avec b autres individus.
Nous définissons une triade comme un ensemble de trois individus quelconques A, B et C. Si
A connaît B et C, la probabilité pour que B et C se connaissent aussi est noté σ. Cette quantité
est parfois appelée ‘fraction de triplets transitifs’ par les sociologues (Wasserman et Faust
1994).
Dans le cas où le graphe des relations sociales serait purement aléatoire, le fait que A
interagisse avec B et C ne change rien aux chances qu’ont B et C d’interagir. Il n’y a aucune
corrélation et, par conséquent, σ = b/N. La cinétique chimique fournit une bonne image de ce
réseau aléatoire. En effet, les molécules se déplacent au hasard dans l’espace. Elles se
rencontrent lors de chocs aléatoires, sans mémoire et se transforment alors mutuellement en
produits. De même, dans le cadre d’un réseau social aléatoire, à chaque instant t, la
probabilité, par unité de temps, de rencontrer un adopteur susceptible d’exercer son influence
est une constante σ = b/N. La probabilité d’adopter par unité de temps est donc σ n. Cette
hypothèse conduit à poser l’équation différentielle:
dn
dt = b n
(1)
N −n N
Cette équation n’est autre que le modèle logistique. Son principal inconvénient est de ne pas
satisfaire à la contrainte n(0)=0 d’un nombre d’adopteur initial nul. Ceci provient du fait que,
pour pouvoir démarrer, le processus d’interaction a besoin d’un nombre d’individus initiaux
non nul. Bass a proposé une modification simple de ce modèle en 1969 qui contourne le
problème en introduisant un terme d’innovation dont le modèle s’écrit:
dn
n
= (a + b ) ( N − n)
dt
N
,
(2)
dont la solution est :
f (t ) =
n(t )
e( a+ b) t − 1
= ( a+ b) t b
N
e
+
.
(3)
a
Notons que durant la phase de croissance pendant laquelle n est très petit devant N, on trouve,
une croissance exponentielle du nombre d'adopteurs. A partir de la phase de croissance,
moment où l’interaction sociale joue pleinement son rôle, les modèles logistiques et le modèle
de Bass sont équivalents.
La structure aléatoire du réseau social favorise la diffusion comme le montre la croissance très
rapide, car exponentielle, du nombre d’adopteur. Cette rapidité est liée à deux propriétés
fondamentales du réseau aléatoire. La première est que, dans ce type de réseau, deux
individus pris au hasard peuvent être reliés l’un à l’autre par un petit nombre d’individus
intermédiaires. Les réseaux sociaux possèdent effectivement cette propriété comme l’a montré
Milgram dans ses fameuses expériences (Kochen 1989). Celles-ci ont montré que pour
trouver un individu pris au hasard aux Etats-Unis, un américain n’a besoin de passer que par
six individus intermédiaires en moyenne. Il en résulte que la contagion va se faire rapidement
car la distance sociale à parcourir est faible.
La seconde propriété est que les phénomènes de saturation n’ont pas lieu durant la phase de
croissance. Des saturations peuvent en effet avoir lieu si σ n’est pas petit comme nous allons
maintenant le décrire.
Examinons d’abord le cas extrême σ=1, c’est-à-dire un réseau social totalement transitif.
L’adage « les amis de mes amis sont amis » est alors ici à prendre au sens strict. Cette
structure de l’interaction est en fait incompatible avec le phénomène de diffusion. En effet, si
A adopte le nouveau produit à t=0, il entraîne, à t=1, b individus Bi à l’adoption. Tous les Bi
connaissent A. D’après le principe de transitivité, tous les individus adoptant à t=3 sous
l’influence des individus Bi connaîtront aussi A et de ce fait, ils auront déjà adopté en t=2 ! La
diffusion n’a donc plus lieu à partir de t=3.
Examinons le cas où σ n’étant pas égal à 1, il n’en demeure pas moins non négligeable. Si A
adopte le nouveau produit à t=0, il entraîne, à t=1, b individus Bi à adopter. Tous les Bi
connaissent A. On est donc en présence de k(k-1)/2 triades susceptibles d’être transitives avec
une probabilité σ. Lorsqu’une triade est transitive, elle ampute de deux le potentiel de
personnes influençables par les Bi. Par conséquent, le nombre d’individus C i n’est que de
k(k-1)σ. La croissance est donc moins rapide que dans le cas du réseau aléatoire. De même,
une fraction des Ci se connaissent, ce qui réduit d’autant leur potentiel d’influence. A ce
stade, les calculs probabilistes deviennent trop complexes pour pouvoir être menés dans le cas
général. Il devient nécessaire de disposer de toute la structure du réseau pour réaliser une
prévision de diffusion. Cette approche est possible sur des réseaux de taille raisonnable et elle
s’est avérée très féconde (Valente 1995). Mais elle n’est pas envisageable à l’échelle de
l’ensemble d’un marché du type de celui qui nous préoccupe.
Si σ est très petit, aucune saturation dans les cercles d’influence directe de chaque individu ne
se fait sentir durant la phase de croissance qui reste donc exponentielle. Le réseau aléatoire
entre dans cette catégorie car σ=b/N tend vers 0 pour les grands N, chaque individu ne
connaissant qu’une petite fraction de l’ensemble des consommateurs qui constituent le
marché.
Ces deux propriétés d’absence de saturation dans le voisinage des individus et de faible
nombre d’intermédiaires entre les individus font du réseau aléatoire un support très efficace
de la diffusion des innovations. Cette efficacité ne doit cependant pas faire perdre de vue
l’irréalisme de la structure aléatoire. Si le faible nombre d’intermédiaires est confirmé
empiriquement par les travaux psychosociologiques déjà cités, il n’en est pas du tout de même
pour la faible valeur du facteur de transitivité σ. Par exemple, en étudiant le réseau social de
225 226 acteurs de cinéma (un acteur est supposé être en relation avec un autre s’ils ont joué
ensemble dans au moins un film), Watts et Strogatz (1998) ont obtenu un nombre moyen de
3,65 intermédiaires pour établir une relation indirecte entre deux acteurs pris au hasard. Cette
valeur très faible milite en faveur d’un réseau aléatoire. Par contre, ils ont mesuré σ = 0,8 ce
qui n’est pas compatible avec un réseau aléatoire. En effet, chaque acteur a joué en moyenne
avec 61 autres. Pour un réseau aléatoire, nous aurions donc observé σ = 61/225226 = 0,00027
qui est bien inférieur à la valeur mesurée. Cette étude montre donc que, au moins dans une
certaine mesure, et en conformité avec l’intuition, ‘les amis de nos amis sont nos amis’. Des
corrélations sont donc induites dans la structure du réseau qui cesse d’être aléatoire. L’origine
de ces corrélations est multiple. L’une d’elle est le principe d’homophilie qui pousse les
individus à se regrouper entre personne de classe socioculturelle équivalente. Dans cette
recherche, nous étudions une autre variable qui peut expliquer, dans certains cas, la présence
de ces corrélations, à savoir la distance géométrique. En effet, si l’effet de voisinage explique
la présence d’interactions entre les individus, le réseau qui en résulte est grandement transitif
car la distance géométrique l’est aussi. Si A est voisin de B et C, alors ces derniers le sont
probablement aussi. Ceci nous conduit à la deuxième structure de réseau social envisagé : la
structure spatiale.
2) Diffusion spatiale des innovations.
Les géographes ont montré depuis les travaux fondateurs de Hägerstrand (1952) que les
individus interagissent d’autant plus facilement qu’ils vivent dans des lieux proches. En
conséquence, lorsqu’un individu adopte un nouveau produit, les nouveaux adopteurs qu’il va
induire se trouve dans son entourage. Ce phénomène à été mis en évidence par Whyte (1954).
Des photographies aériennes de la banlieue de Philadelphie ont permis à l’auteur de repérer
les maisons équipées de climatiseurs. Celles-ci n’étaient pas distribuées au hasard, mais
présentaient des agrégats. Ainsi, l’influence des voisins les uns sur les autres a été prouvée.
Notons que l’explication du phénomène par des variables exclusivement individuelles mais
corrélées à l’espace par le type d’habitation et de quartier (CSP, age, type de foyer…) était
exclue grâce à la grande homogénéité socioprofessionnelle de ces quartiers.
Le concept fondamental de la diffusion géographique est la notion de front de diffusion
(Hägerstrand 1952). Ce front représente les lignes de séparation entre les zones où les
individus ont adopté l’innovation et celles ou ils ne l’ont pas encore fait. Ce front avance au
cours du temps à la manière d’un mascaret à partir des lieux pionniers dans l’adoption de
l’innovation. Un bon exemple de diffusion géographique à l’échelle de la France est celui de
la diffusion du maïs dans la période d’après guerre à propos de laquelle Mendras (1970) écrit
« En 1959, alors que le maïs hybride avait été introduit depuis 10 ans dans la vallée de Nay,
19 agriculteurs sur 100 ne cultivaient pas de maïs hybride et 36 en cultivaient moins d’un
hectare. Le maïs hybride, venu d’Amérique, avait été introduit dans le sud-ouest après la
libération […] les conversations avec les agriculteurs et l’observation des champs des voisins
ont naturellement beaucoup plus d’importance à mesure que la culture se répands, on voit des
champs d’hybrides un peu partout et que les conversations à ce sujet deviennent plus
fréquentes. La tentative des pionniers a mis plusieurs années à faire tâche d’huile et à
convaincre les autres. »
La modélisation quantitative de cette diffusion spatiale a fait l’objet de trop peu de recherches
en marketing, contrairement à ce que l’on observe en géographie. On citera les travaux de
Mahajan V. et Peterson R. (1979) et de A. Cliff et Ord (1975). Ces auteurs ont étudié la
diffusion spatiale des tracteurs dans les régions centrales des Etats-Unis. Leur modélisation
permet en particulier d’estimer un coefficient d’interaction sociale entre des régions
prédéfinies. On attend d’une manière générale que ce coefficient soit d’autant plus petit qu’il
concerne des régions plus éloignées l’une de l’autre. Une autre possibilité est de le faire
dépendre, dans le cas d’un nouveau produit de télécommunication, de la quantité d’échanges
téléphoniques entre les deux régions (Steyer A. Et Zimmermann J. B. 1996) . Notre recherche
ne porte pas sur l’analyse spatiale du phénomène de diffusion mais sur le lien entre
l’évolution temporelle de la diffusion et la structure géographique qui lui sert de support.
Nous ne disposons cependant pas de données spatiales exhaustives. De ce fait, nous
restreindrons notre analyse à des modèles dans lesquels l’espace et les individus sont supposés
homogènes.
Cela exclut en conséquence une partie des résultats obtenus par les géographes qui ont montré
comment la hiérarchie des villes (induite par leurs tailles et leurs proximités) structurait la
diffusion qui se fait alors des villes les plus centrales vers les villes les plus périphériques
(Brown et Cox 1971).
Une autre conséquence de notre hypothèse d’homogénéité de l’espace est que la vitesse du
front de diffusion est constante durant la phase de croissance. Ceci est raisonnable dans la
mesure ou le temps mis par le front de diffusion pour avancer d’un individu à l’autre est égal
au temps mis par un individu pour parvenir à influencer un de ses pairs. C’est donc une
constante si les individus et l’espace sont homogènes.
A un instant donné, les zones géographiques occupées par des adopteurs sont des agrégats ou
encore des « tâches d’huile », dont les frontières sont le front de diffusion. Ces tâches
grossissent à mesure que leurs frontières avancent à vitesse constante. Leur rayon augmente
donc linéairement avec le temps. Le nombre de nouveaux adopteurs est à chaque instant
proportionnel à l’augmentation de la surface des tâches. Il est donc aussi proportionnel au
rayon moyen des tâches. Ce rayon peut être exprimé en fonction de deux quantités
différentes. D’une part, le front de diffusion avançant à vitesse constante, le rayon des tâches
doit augmenter linéairement avec le temps. De ce fait, le nombre de nouveaux adopteurs est
dn
lui aussi une fonction linéaire du temps, soit
= b t.
dt
D’autre part la surface des tâches est proportionnelle au carré de leur rayon. La surface étant
proportionnelle au nombre d’adopteurs, on en déduit que le rayon est proportionnel à la racine
dn
de n. Le nombre de nouveaux adopteurs s’exprime donc aussi comme
= b' n .
dt
Si on multiplie le nombre de nouveau adopteurs par N-n pour faire intervenir le phénomène
de saturation, on obtient donc deux modèles de diffusion géographique :
dn
= b t ( N − n) ,
(4a)
dt
dn
= b' n ( N − n) .
dt
(4b)
Le premier modèle (4a) est un cas particulier du modèle de dont la solution est une des lois de
Weibull
2
n(t )
f (t ) =
= 1− e − b t
(5a)
N
(
)
Remarquons que ce modèle ne comporte que deux paramètres, soit un de moins que le modèle
de Bass. Notons que la loi de Weibull proposé par Sharif et Islam (1980) comme courbe de
diffusion n’avait pas jusqu’ici reçu d’interprétation en terme d’interaction sociale.
L’autre modèle est un cas particulier de courbe logistique non symétrique de Easingwood,
Mahajan et Muller (1981). Ceci est aussi un cas particulier du modèle d’influence non
uniforme Easingwood, Mahajan et Muller (1983). La solution de (4b) est :
2
n(t )  e b' t −1 
=  b' t  .
f (t ) =
(5b)
N
 e +1
Nous disposons donc de deux modèles de diffusion géographique. Ces deux modèles sont
équivalents durant la phase de croissance parabolique pendant laquelle on a n ≈ N b t 2 .
3) Sélection des jeux de données pour l’analyse empirique.
Nous avons testé la pertinence des courbes de diffusion (5a) et (5b) sur un ensemble de
données empiriques, et comparé les résultats avec ceux obtenus avec le modèle de Bass (3).
Les données ont été choisies car elles sont issues de travaux de recherche mettant en évidence
une forte composante géographique dans la diffusion de l’innovation concernée. Les modèles
que nous proposons ne sont en effet valables que pour des diffusions pour lesquelles le
caractère géographique est central. Nous allons donc tester l’hypothèse d’une meilleure
adéquation aux données des courbes de diffusion (5a) et (5b) par rapport à la courbe de
diffusion de Bass (3). La comparaison doit cependant être nuancée car le modèle de Bass
comporte un paramètre de plus que les modèles géographiques. Les deux modèles n’étant pas
emboîtés, l’estimation par maximum de vraisemblance ne peut nous aider dans la
comparaison des deux modèles. Nous nous contenterons donc des écarts quadratiques
moyens.
Trois jeux de données ont été examinés. Le premier est un retour aux sources puisqu’il s’agit
des données utilisées par Hagerstrand lui-même dans son étude fondatrice sur la diffusion
spatiale des innovations. Ce jeu de donné nous assure donc de disposer d’un cas pour lequel la
dimension géographique de la diffusion est non seulement prouvée mais aussi parfaitement
centrale dans l’explication de l’évolution temporelle du nombre d’adopteurs. L’innovation
considérée par Hägerstrand est une subvention octroyée par le gouvernement suédois à partir
de 1928 aux petites exploitations agricoles en échange de la conversion de surfaces boisées en
herbage. L’auteur fournit le nombre de nouvelles subventions annuelles entre 1928 et 1944
pour la région étudiée (Östergötaland, Suède). La figure 1 reproduit ces données.
Le deuxième jeu de données est une des innovations utilisée par Bass (1969) pour fonder son
modèle, à savoir la diffusion des climatiseurs d’air aux Etats-Unis. Celle-ci a été choisie
parmi les autres car c’est la seule pour laquelle une étude empirique a montré sans ambiguïté
l’importance du voisinage géographique dans la diffusion (Whyte 1954). Par ailleurs
Easingwood, Mahajan et Muller (1983) ont appliqué le modèle d’influence non uniforme sur
ces données et ont obtenu l’équation de diffusion suivante :
0 , 4954

dn 
 n 
= 0,000168 + 0,2013

 (22389 − n)
dt 
 22389 

Or, on peut remarquer que le coefficient d’innovation 0,000168 est très petit et que l’exposant
d’influence 0,4954 est très proche de 1/2. Les valeurs empiriques des paramètres de ce
modèle le rendent donc très proche du modèle géographique [5b]. Ces deux arguments font de
la diffusion des climatiseurs un très bon candidat de diffusion géographique.
Néanmoins la dimension spatiale n’est pas la seule explication de la diffusion. D’autres
variables comme le prix ou la publicité peuvent influencer la diffusion, et donc les qualités
d’ajustement du modèle. Pour cette raison nous avons construit un troisième jeu de données
de diffusion virtuelle sur un réseau social réel dans lequel seule la structure de l’interaction
entre les individus explique la diffusion. La pertinence par rapport à notre thème de recherche
impose cependant que cette interaction possède une dimension spatiale importante. C’est pour
cette raison que nous avons utilisé le sociogramme publié par Rogers (1995) page 302
concernant les habitants d’un quartier dont les relations de voisinage sont en partie structurées
par le lieu d’habitation. Rogers qui avait pour objectif d’étudier la diffusion d’équipement en
énergie solaire observe lui aussi des agrégats et écrit à leur sujet : «such agrégats occur
because the nearby neighbors of an initial adopter are influenced to adopt ».
Les 44 individus qui composent ce sociogramme sont en moyenne en relation avec 2,6 voisins
chaque semaine (niveau de fréquence minimum choisi pour définir la relation sociale). Si le
réseau était aléatoire, nous devrions mesurer pour σ une valeur de 2,6/44 = 0,06. Au lieu de
cela, nous avons mesuré σ = 0,33. L’effet de voisinage est donc particulièrement important
dans ce sociogramme qui par conséquent un bon candidat pour une modélisation spatiale des
interactions.
Pour construire la courbe de diffusion correspondant à ce réseau social, nous partons d’un seul
adopteur initial, l’innovateur. Au temps suivant, tous les habitants avec lesquels il déclare
parler au moins une fois par semaine sont supposés être de nouveaux adopteurs. Nous
continuons ainsi de proche en proche : chaque nouvel adopteurs induit tous les habitants avec
qui il discute au moins une fois par semaine à adopter au temps suivant. Cette diffusion
virtuelle est réalisée pour chaque individu non isolé. La courbe de diffusion utilisée est la
somme de toutes les courbes de diffusions virtuelles. La courbe résultante est illustrée en
figure 2.
4) Résultats empiriques des quatre modèles.
Munis de ces trois jeux de données, nous avons procédé à des estimations en utilisant la
régression non linéaire dans la formulation proposée par Jain et Rao (1990). Ainsi, si le
nombre de nouveaux adopteurs observé est v(t) et si leur nombre total est n(t) à chacun des T
instants t, on pose
v(t) =
N − n(t )
( f (t ) − f (t − 1) ) + ε t
1 − f (t )
où les ε t sont T résidus. Un algorithme classique de gradient conjugué nous permet de
1
ε t2 en faisant varier les paramètres. L’écart quadratique moyen
trouver le minimum de
∑
T t
1
est la valeur du minimum de ∑ ε t2 obtenu. Ces écarts sont consignés dans le tableau 1.
T t
Les résultats concernant les données de Hagerstrand sont conformes aux hypothèses. Les
modèles géographiques sont meilleurs que le modèle de Bass. Ils s’adaptent mieux aux
données de Hägerstrand alors qu’ils sont moins flexibles que le modèle de Bass qui comporte
un paramètre de plus. Cette situation confirme l’intérêt des modèles géographiques pour ce
cas d’innovation directement lié à la géographie (domaine agricole). On constate que le
modèle (5a) est systématiquement meilleur que le modèle (5b). Ce dernier ne sera donc plus
considéré dans la suite de notre recherche.
Concernant les autres données, le modèle de diffusion géographique ne souffre pas la
comparaison. Ceci est particulièrement gênant pour la diffusion sur le sociogramme de
Rogers. Sa nature même impose en effet une dimension spatiale sous-jacente et sa valeur de σ
montre qu’il est beaucoup plus transitif qu’un réseau aléatoire. Pourtant le modèle aléatoire de
Bass est plus performant. Ceci nous conduit à remettre en question le modèle géographique et
à en créer un autre dans la section suivante.
5) Modèles des avalanches spatiales
La courbe de diffusion est le reflet direct de la géométrie de l’interaction sociale. Or le modèle
de diffusion géographique fait l’hypothèse que l’ensemble des interactions entre individus se
fait d’un voisin à un autre dans un plan euclidien. Cette exclusivité spatiale des interactions
aboutit à un modèle trop restreint pour s’ajuster aux données, sauf dans le cas d’une diffusion
purement géographique. Une extension du modèle géographique consiste à lui ajouter la
possibilité d’autres types d’interactions. Nous proposons donc un nouveau modèle de
diffusion que nous appelons modèle de diffusion en avalanche spatiale. La notion d’avalanche
spatiale généralise la notion de tâche d’huile car elle peut s’étendre aussi bien dans l’espace
qu’à travers un autre réseau. Nous avons vu dans la première partie de cet article que le réseau
aléatoire présentait l’avantage de ne demander que quelques liens pour relier entre eux les
individus (loi de Milgram) et ceci en conformité avec les mesures empiriques. La
conséquence de cette propriété est la croissance exponentielle du nombre d’adopteurs. Le
réseau purement spatial que nous avons ensuite envisagé présente la propriété réaliste de
transitivité mesurée par des valeurs élevées de σ. La conséquence de cette transitivité induite
par l’effet de voisinage est une croissance parabolique du nombre de nouveaux adopteurs.
Ces deux propriétés, transitivité et faible nombre d’intermédiaires, étaient considérées comme
antinomiques jusqu’aux travaux de Watts et Strogatz (1998) qui ont décrit des réseaux où
elles coexistent. Ces réseaux appelés ‘petits mondes’ sont une superposition de structures
régulière et aléatoire. L’une d’entre elle retient toute notre attention car elle suppose les
individus positionnés sur un plan euclidien entretenant des relations soit avec leurs voisins les
plus proches (réseau régulier) soit d’autres individus choisis au hasard (réseau aléatoire).
Cette structure va nous permettre de conserver les avantages de la diffusion aléatoire et de la
diffusion géographique. Le modèle que nous allons établir sera intermédiaire entre les
croissances parabolique et exponentielle et son ajustement devrait être supérieur à la fois au
modèle de Bass et au modèle géographique.
Dans le modèle d’avalanche spatiale les tâches d’huile s’étendent comme dans le modèle
géographique mais les individus atteints par le front de diffusion sont susceptibles de donner
eux-même naissance, via le réseau aléatoire, à de nouvelles tâches en d’autres lieux.
Dans un premier temps, nous modélisons la phase de croissance. Il sera ensuite facile de
modéliser l’ensemble de la courbe de diffusion par la multiplication des ventes par N-n afin
de prendre en compte l’effet de saturation du marché comme cela a été fait précédemment. Si
dn
n(t) désigne toujours le nombre total d’adopteurs,
est le nombre de nouveaux adopteurs.
dt
Ceux-ci peuvent provenir soit de la propagation du front de diffusion de la première tâche
d’huile, soit d’une tâche née au temps τ, τ pouvant être quelconque entre 0 et t. Dans le
dn
premier cas, on a conformément à (4)
= b t . Dans le deuxième cas, si la tâche d’huile
dt
secondaire est née à t= τ, deux phénomènes ont eu lieu. Le premier est la naissance de la
tâche, le second est sa propagation. Une tâche a d’autant plus de chance de naître à l’instant τ
qu’il y a de nouveaux adopteurs à cet instant. Soit α la probabilité de donner naissance à une
nouvelle tâche par un nouvel adopteur. Une fois née, cette tache a un temps t- τ pour se
propager jusqu’à l’instant t. Le bilan global peut donc s’écrire :
dn
=bt +α
dt
∫
t
0
dn(τ )
b (t − τ ) dτ
dτ
(6)
En effectuant une intégration par partie (avec n(0)=0) on obtient :
t
dn
= b t + α b ∫ n(τ ) dτ
0
dt
Une dérivation de cette équation suivie d’une multiplication par
dn
conduit à
dt
dn
dn
d 2 n dn
= b + α b n(t )
2
dt
dt
dt dt
dont l’intégration et la multiplication par le terme de saturation N-n donne l’expression des
nouveaux adopteurs:
dn
=
dt
2b n + α b n 2 ( N − n )
La solution de ce modèle d’avalanches spatiales est :
f (t ) =
(
)
ch t b(2 + α ) − 1
n(t )
=
N
ch t b(2 + α ) + α + 1
(
)
(7)
Comme celui de Bass, ce modèle comporte trois paramètres. Il lui est très proche puisque
qu’il suffit de changer les exponentielles en cosinus hyperbolique dans (3) pour trouver (7).
Aux temps longs, les deux modèles sont donc équivalents. Cependant au début de la phase de
croissance, au moment où la diffusion des tâches régule la dynamique de la diffusion, ce
modèle se comporte comme un modèle géographique avec une croissance parabolique. C’est
donc bien un modèle intermédiaire entre les modèles de Bass et géographique.
6) Performances du modèle en avalanches spatiales.
Notre modèle a été testé sur les trois jeux de données dans les mêmes conditions que celui de
Bass. Si les données très imprégnées de dimensions géographiques pures de Hägenstrand ne
bénéficient pas d’une amélioration de l’ajustement par les avalanches spatiales, la situation est
toute autre pour les climatiseurs. Le gain par rapport aux modèles géographique est en effet
important (20%) et ceci à nombre de paramètre identique. La diffusion des climatiseurs est
donc mieux prise en compte par notre modèle. Cette amélioration de l’ajustement provient
vraisemblablement d’une meilleure prise en compte de la structure de l’interaction puisque la
diffusion simulée sur le sociogramme de Rogers bénéficie d’une amélioration encore plus
importante (60%) quand on utilise le modèle des avalanches spatiales plutôt que celui de
Bass. Notre objectif est donc atteint puisque nous disposons d’un modèle de diffusion à trois
paramètres basé sur une géométrie de l’interaction différente de celle de Bass et dont les
performances en ajustement sont meilleures. Dans le but d’applications nous devons
également valider les capacités prédictives de ce modèle comparées à celui de Bass. Nous
reprenons pour ce faire la même démarche que ce dernier, basée sur la prévision a posteriori,
dans son article de 1969. Pour chaque année postérieure au point d’inflexion de la courbe de
diffusion empirique, les modèles sont estimés et une prévision en est déduite pour l’année
suivante. L’écart quadratique moyen entre les prévisions et le nombre réel de nouveaux
adopteurs est alors calculé comme indicateur de la performance prédictive des deux modèles.
Les valeurs obtenues sont consignées dans le tableau 2. Elles confirment la supériorité du
modèle des avalanches spatiales.
7) Conclusion
Nous avons construit un modèle de diffusion temporel dans la lignée des travaux sur la
diffusion spatiale de Hägerstrand. Ce modèle a été validé sur les données géographiques de
Hägerstrand mais pas sur des données du champ du marketing choisies en raison du rôle
prouvé de la dimension spatiale dans la diffusion qu’elles mesurent. Paradoxalement, le
modèle de Bass qui néglige toute corrélation dans la structure sociale est meilleur en
ajustement dans ce cas. Ce constat nous a conduit à proposer un nouveau modèle
d’avalanches spatiales qui sont susceptibles de se propager tant par effet de voisinage que par
interactions aléatoires. La structure du réseau social qui sous-tend ce nouveau modèle est
appelée ‘petit monde’. Elle s’est déjà avérée utile dans la modélisation des réseaux sociaux.
Ce nouveau modèle s’est alors montré supérieur au modèle de Bass tant en ajustement qu’en
prévision. Certaines limitations doivent cependant être notées.
Les résultats ont été obtenus sur trois jeux de données seulement. Il convient donc, comme
pour tout modèle, de l’éprouver sur un plus grand nombre de cas pour lesquels la dimension
géographique est pertinente.
Le modèle que nous avons construit ne prétend à aucune universalité. Si ses performances
sont clairement supérieures à celles du modèle de Bass, ce n’est que dans un contexte bien
particulier où la dimension spatiale joue un rôle important dans le phénomène de diffusion.
Les perspectives ouvertes par ce travail ne concernent pas seulement la diffusion
géographique. Il est en effet possible d’améliorer notre modèle par exemple en introduisant un
effet de hiérarchie suivant la théorie des places centrales (Brown et Cox 1971), en plus de
l’effet de voisinage, renonçant par-là même à l’hypothèse d’homogénéité de l’espace. La
vitesse du front de diffusion pourrait aussi être supposée variable.
Enfin, ce travail introduit une démarche générale à travers l’analyse du cas particulier de la
diffusion spatiale. La démarche générale qui nous souhaitons voir se développer consiste à
s’interroger sur le lien entre l’évolution temporelle du nombre d’adopteurs et la structure du
réseau social sous-jacent à la diffusion et à travers lequel opère le processus d’influence
interpersonnelle. Le nombre de structures étant sans limite, nous espérons qu’elles donneront
lieu à de nombreux autres modèles de diffusion aux applications mieux ciblées et moins
illusoirement universelles.
BIBLIOGRAPHIE
Bass F. M. (1969), A new product growth model for consumer durables, Management
Science, 15, 215-227.
Bass F. M., Krishnan T. V. et Jain D. C. (1994), Why the Bass model fits without decision
variables, Marketing Science, vol. 13, n°3 p203-223.
Brown L. A. et Cox K. R. (1971), Annals of the Association of American Geographer, 61,
551-559.
Cestre G. (1996), Diffusion et innovativité : définition, modélisation et mesure, Recherche et
Applications Marketing, 11, 1, 69-88.
Cliff A. D. et Ord J. K. (1975) Space-time modelling with an application to regional
forecasting, Institute of British Geographer, Publications, 64, 119-128.
De Palma A., Droesbeke J-J. et Lefèvre C. (1991), Modèles de diffusion en marketing, PUF.
Easingwood C. J., Mahajan V. et Muller E. (1981), A nonsymetric responding logistic model
for forecasting technological substitution, Technological forecasting and social change, 20,
199-213.
Easingwood C. J., Mahajan V. et Muller E. (1983), A non-uniform influence innovation
diffusion model of new product acceptance, marketing science, 2, 273-296 traduit dans RAM
vol 2, n°3, 1987.
El Ouardighi F. et Tapiero C. S. (1997), Modèles de Diffusion en Marketing, RAM, vol 12,
n°4, 15-40.
Hägerstrand T. (1952), The propagation of innovation waves, Lund Studies in Geography.
Hägerstrand T. (1967), Innovation diffusion as a spatial process, University of Chicago Press.
Jain D. C. et Rao R. C. (1990), Effect of Price on the demand for durables: modeling,
estimation and findings, Journal of Business and economic statistics, 8, 163-170.
Kochen M (ed) (1989), The Small World, Ablex, Norwood, NJ.
Mendras H. (1970), La fin des paysans, Paris.
Mahajan V. et Peterson R. A. (1979) Integrating time and space in technological substitution
models, Technological Forcasting and Social change, 14, 231-241.
Parker P. M.(1994), Aggregate diffusion forecasting models in marketing: A critical Review,
Int. Journ. of Forecasting, 10, 353-380.
Rogers E. M. (1995), Diffusion of Innovations, The Free Press, New York
Sharif M. N. et Islam M. N. (1980), the weibull distribution as a general model fo forecasting
technological change, Technological forecasting and social change, 18, 247-256.
Steyer A. Et Zimmermann J. B. (1996), Externalité de Réseau et Adoption d’un Standard dans
une structure Résiliaire, Revue d’Economie Industrielle, 76, 67-90.
Valente T. W. (1995), Netwok Models of the Diffusion of Innovations, Hampton Press.
Wasserman S. et Faust K. (1994), Social Network Analysis : Methods ans Applications,
Cambridge University Press.
Watts D. J. et Strogatz S. (1998), Collective dynamics of small-world networks, Nature 393, 4
p 440-442.
Whyte W. H. Jr (1954), The Web of Word of Mouth, Fortune, novembre 1954, 140-212.
FIGURES
Figure 1: Données de Hägerstrand
nouvelles subventions
600
500
400
300
200
100
0
1925
1930
1935
1940
1945
année
nouveaux adopteurs
Figure 2: Simulation de diffusions sur
sociogramme réel
300
250
200
150
100
50
0
0
2
4
6
temps
8
10
TABLEAUX
Tableau 1 : Valeurs des écarts quadratiques moyens obtenus pour les différents modèles sur
les trois jeux de données.
Données
Rogers (simulation) Bass (air climatisé)
Hägerstrand
Modèle de Bass [3]
19
23 816
7 431
Modèle géographique [5a]
1 003
38 791
5 772
Modèle géographique [5b]
1 600
40 348
5 946
Modèle d’avalanches spatiales
8
18 985
5 874
Tableau 2 : Erreur quadratiques moyennes de prévisions à un an pour les deux modèles à trois
paramètres.
Données
Rogers (simulation)
Bass (air climatisé)
Erreur quadratique de prévision avec le
modèle de Bass
124
121 227
Erreur quadratique de prévision avec le
modèle d’avalanches spatiales
73
8 866
Nombre de pas de temps de prévision
4
5
!"#$%$&$$&
$%'$&$()$
*%+,-
**
&
!"#!$%%&
'()
*+ ,
-./++01!/