Google l`entonnoir

Transcription

Google l`entonnoir
Google l’entonnoir
Gabriel Gallezot
Google
Qu’est-ce que c’est ?
• 1996 :
•
– projet de recherche BackRub, de Sergey Brin et Larry
Page (en PhD à Stanford) : méthode d'analyse des liens
pointant vers un site web.
– Naissance le 7 septembre 1998, à Stanford, de la startup Google
– Le nom : dérivé du mot «googol » , nombre gigantesque
(un 1 suivi de 100 zéros...).
1999 : de 500 000 à 3 millions requêtes par jour
PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) )
A partir des dia de l’Urfist de Rennes
La machine s’emballe ...
• 2000 : premières publicités contextuelles, un demi-milliard de
pages Web indexées ; déjà 100 millions de requêtes par jour
• 2001 : Rachat de Deja.com et de l'archivage de Usenet,
création de Google Groups ; lancement de Images Search;
indexation de nouveaux formats de fichiers (.doc; .xls, .ppt...)
• 2002 : Lancement du modèle publicitaire des AdWords ;
lancement officiel de Google News, indexant plus de 4000 sites
de médias ; Fin 2002 : 250 millions de requêtes journalières
• 2003 : Rachat de plusieurs sociétés :
– Applied Semantics : technologie autour des mots-clés
– Blogger : édition de blogs
– Sprinks : publicité contextuelle
– Programme publicitaire AdSense
A partir des dia de l’Urfist de Rennes
... et ça continue
• 2004 :
–
–
–
–
–
–
Recherche localisée avec Google Local.
Gmail, service de webmail gratuit
Introduction en Bourse, envolée boursière
Picasa, gestion des photos numériques
Google Desktop, indexation des disques durs
Novembre : doublement de l’index : de 4,3 milliards à 8,1
millards de pages
– Google Scholar
• 2005 :
– Lancement de : Google Video, Google Maps, Google Earth,
Google Talk
– Annonce de Google Print et de la numérisation des livres
– Augmentation de l’action Google de 117 % en un an
– Fin 2005 : 1 milliard de requêtes journalières !
A partir des dia de l’Urfist de Rennes
... et encore
•
2006 :
– Lancement de Google.cn en Chine, avec une censure des
résultats
– Rachat de Writely, qui deviendra Google Docs & Spreadsheets
en octobre
– Lancement de plusieurs applications : Google Calendar, Co-Op,
Trends, Apps...
– Automne : Google News Archives, rachat de You Tube
• 2007 :
– Rachat de DoubleClick, pour $ 3,1 Mds ;
– Automne : 1 million de livres numérisés, 27 partenaires pour
Google Books
• 2008 :
– Mars : annonce de Google Health, le dossier médical personnel
en ligne
– Juin : partenariat avec Yahoo pour le partage du marché
publicitaire
– Juillet : Google a70 % du trafic aux USA, 82 % en France
– Septembre : lancement du navigateur Google Chrome
A partir des dia de l’Urfist de Rennes
• 2009 :
etc...
– Février : lancement de Google Latitude, service de géolocalisation
sur téléphone mobile
– Mai : lancement de Google Wave, plateforme centralisée de
communication
– Septembre : lancement de SideWiki
– Octobre :
• Partenariat avec Twitter, indexation des tweets
• lancement de Google Social Search, moteur de recherche
social
– Novembre :
• Lancement de Google DashBoard
...
•
•
•
•
.... Dernières annonces en date (mai 2010)
relooking de Google (léger)
Google e-book store (cet été ?)
....
A partir des dia de l’Urfist de Rennes
... Bref
Innovations + rachats + marketing
⇒ Du PageRank au « PageBank »
•
Publicité = 97% de son CA => régie publicitaire
• dernier trimestre 09 : 5,9 Mrds $ de revenus
• Des réserves de trésorerie au plus haut : 22 Mrds $
Hégémonie de google
sur le marché des
moteurs => recettes
publicitaires
imporantes
A partir des dia de l’Urfist de Rennes
Une liste à pub
• En Europe, 8 requêtes sur 10 passent par
Google
• Usages : utilisation des 1er résultats
• Illusion d’infini : affiche des millions de résultats
en réalité inacessibles (blocage avant les 1000
résultats)
• Aspect tautologique : les 1er résultats toujours
renforcés
...et mes traces de navigation ?
• Conservation des requêtes (Cf google trends,
Dashboard) et cookies
Google une régie publicitaire
Premium SponsorShip (CPM)
Adwords Select (CPC
Résultats du « page rank »
QuickTimeᆰ et un
dホcompresseur BMP
sont requis pour visionner cete image.
Golden
Triangle
http://eyetools.com/research_google_eyetracking_heatmap.html
Comprendre Google
Voir google pour ce qu’il est :
- pas un outil magique (« I’m feeling lucky »)
- pas le diable (« don’t be evil »)
=> mais un média
Documents
Alimente
Créer des médias
adaptés à chacun.
Publics
Internet
E-services dans les nuages
Début OS en ligne (cf android)
Doc électro
Doc papier
BdD
Page web
liens news
blog forum
mail microblogging
s
ag
e
im
ne
w
s
bl
og
s
al
er
te
cu
st
om
sc
ho
la
vi r
dé
o
liv
re
s
ca
rte
W
eb
Outils de Recherche
Les axes de developpement
du média google
• Paradigme du flux vs. paradigme du
stock
• Economie de l’attention vs. économie
de la rareté
Paradigme
du flux
Documents
• Web
• Numérisation
• Tri du web
• Numérisation de masse
• Crowdsourcing
The machine is us/ing us
Médias ciblés
pour un public
Livraison
Sources
Public
Paradigme du stock
Web2.0
Participation des foules à :
• La correction de pages
• De bugs
• D’amélioration de services
• ... alimentation
Economie de
l’attention
• Loi de Paréto / loi de puissance
(20 / 80)
• économie de la rareté : rareté de
l’offre, pression de la demande
=> coût du produit qui monte
• La longue traîne : c’est l’addition
de produits qui se vendent peu
=> rendre chaque chose disponible
=> aider à la trouver
Popularité
20% des produits
font 80% des ventes
La longue traîne
Produits
⇒ Rareté de la demande
⇒ Economie de l’attention
⇒ Captation de la demande,
par la porte d’entrée
« moteur de recherche »
... Et nous ...Et nos
documents dans tout
ça ?
• Que deviennent les documents, leurs
relations, leur « vie sociale » ?
• Comment cet entonnoir redéfinit-il les
règles du jeu de l'usage de
l'information, et donc finalement de la
production des documents ?
=> Etudier les multiples impacts de son existence
sur la sphère informationnelle. Trouver les axes
d'analyse qui partent des pratiques des usagers,
du petit bout de l'entonnoir.
La notion de « flou » comme fil rouge
• méconnaissance des outils de recherche tend
à objectiver les résultats fournis par Google.
=> Phénomène lié à l'intelligibilité des
typologies et techniques documentaires, des
techniques (algorithmiques) stochastiques et
à la surcharge informationnelle.
• des usagers désorientés par la
déconstruction/reconstruction de leur univers
documentaire
=> En cause la versatilité des services, des
sources, des interfaces d'interrogation,
rythmée par les rachats et les fusions
d'entreprises.
Quel flou ?
• Flou cognitif (perte d’intelligibilité)
• Flou sémiotique (perte de repères)
⇒ Différentes situations de flou
Le flou chez les étudiants
(Brigitte Simonot)
• un public acculturées aux moteurs de recherche placés dans
une situation d’acquisition de méthodologie de travail
• Position hégémonique de Google, plébiscité pour sa facilité
d’usage et son côté intuitif
• le recours fréquent aux moteurs n’amène pas les étudiants à
questionner les fondements d’une démarche informationnelle
aboutie et n’améliore pas leurs connaissances
infodocumentaires
• Il leur donne surtout une illusion d’autonomie, entretenue par un
manque d’intelligibilité des outils de recherche et des
ressources documentaires.
• => formations pour mieux gérer, évaluer et maîtriser la densité
d'information, acquérir une meilleure autonomie et ne pas
laisser le moteur régler la sélection des sources à leur place.
Le flou chez les journalistes
(Nicolas Pélissier et Mamadou Diouma Diallo)
• Public de spécialistes de l’information
• Ont fait la part belle à google dans leur colonnes
• montée en puissance des sources électroniques par rapport
aux sources traditionnelles – orales et imprimées – dans
cette profession
• des pratiques d’enquêtes de plus en plus sédentaires où le
réseau prend une part grandissante (place de choix pour
Google)
• ces professionnels de l’information semblent prendre peu de
recul par rapport à leurs usages du moteur.
=> Les formations des journalistes devraient prendre en compte
cet aspect pour doter les futurs professionnels d’éléments
méthodologiques et éthiques plus poussés
La question de formation pour répondre au flou
(Alexandre Serres et Olivier Ledeuf)
• Une formation aux outils de recherche doit s'appuyer
plus largement sur le développement de la culture
informationnelle
• Les auteurs relèvent plusieurs « confusions
sémantiques » induites par les moteurs qui
participent à un « brouillage » des notions infodocumentaires.
– Confusion entre les différentes approches de la pertinence :
pertinence topicale (relevance), pertinence-système,
pertinence-utilisateur.
– Confusion entre mesures d’audience et influence.
– Confusion enfin entre autorité et popularité.
• Face aux enjeux sociopolitiques soulevés les
moteurs de recherche => la mise en œuvre d’un
véritable travail de réflexion sur la didactique de
l’information.
Le flou dans la machine
(Olivier Ertzscheid, Gabriel Gallezot et Eric Boutin)
• de l’origine "scientométriques" du PageRank™ à son
opacité (la boîte noire)
• Instrumentalisation du concept de pertinence par le
moteur et son détournement au profit d’une logique
marchande
• Des situations de flou et d’ambigüité s’installent,
comprises entre une vision amoindrie de la réalité
documentaire et une fuzzy search contrôlée
– L’usager profane « decouvre » plus qui ne
« recherche »
– L’usager expert doit accepté l’aléatoire, la fortuité, la
serendipité
• les usagers ont ou n'ont pas la possibilité ou la capacité
de subjectiver leur recherche, du moins ne savent pas ou
peu se défaire de l' « objectivation » imposée par Google
• => aspect didactique et heuristique de relevance et de la
sérendipité pour combatre ce flou
Le flou de l’interface
(Jacques Araszkiewiez)
• Analyse sémiologique de la page d’accueil
• Le sujet est avaler par l’interface, par la “one
box” : “le grand a-valeur”
=> processus de désubjectivation du dispositif
socio-technique
=> Avec le web les médias, comme dispositifs,
ne sont plus seulement une représentation
métaphorique du monde mais
métonymique, jettant en cela un flou sur
notre réel.
Le flou du discours
(Céline Lacroix et Paul Rasse)
• Un discours qui oscille entre culture
d’entreprise et valeurs culturelles universelles
• Le discours de Google s’appuie à la fois sur
des valeurs politiques (ie. la démocratie) et
économiques dont il joue à contre pied pour
finalement mettre en exergue deux
sentiments : la croyance et la confiance, qui
sont dès lors érigées en valeurs
=> le discours affiché sur le site de Google
procède d’une rhétorique publicitaire
masquée faite de glissements de sens, un
flou sémiotique bien entretenu
Le flou dans l’avenir
(Cory Doctorow)
• Un nouvelle de SF
• Comment se faire Engooglés
• Sur les dérives possibles des informations
détenues et leurs utilisations
• Relations fictives entre le DHS (département
of Homeland Security) et Google
• “évaluation” des individus à la douane des
aéroports par la publicité contextuelle autour
de leur documents (... puis dérives
succesives)
... En guise de conclusion
Trop de google ?
Attention aux
associations
symbiotiques
Vos questions ?