Google l`entonnoir
Transcription
Google l`entonnoir
Google l’entonnoir Gabriel Gallezot Google Qu’est-ce que c’est ? • 1996 : • – projet de recherche BackRub, de Sergey Brin et Larry Page (en PhD à Stanford) : méthode d'analyse des liens pointant vers un site web. – Naissance le 7 septembre 1998, à Stanford, de la startup Google – Le nom : dérivé du mot «googol » , nombre gigantesque (un 1 suivi de 100 zéros...). 1999 : de 500 000 à 3 millions requêtes par jour PR(B) = (1-d) + d x ( PR(A1) / N(A1) + ... + PR(An) / N(An) ) A partir des dia de l’Urfist de Rennes La machine s’emballe ... • 2000 : premières publicités contextuelles, un demi-milliard de pages Web indexées ; déjà 100 millions de requêtes par jour • 2001 : Rachat de Deja.com et de l'archivage de Usenet, création de Google Groups ; lancement de Images Search; indexation de nouveaux formats de fichiers (.doc; .xls, .ppt...) • 2002 : Lancement du modèle publicitaire des AdWords ; lancement officiel de Google News, indexant plus de 4000 sites de médias ; Fin 2002 : 250 millions de requêtes journalières • 2003 : Rachat de plusieurs sociétés : – Applied Semantics : technologie autour des mots-clés – Blogger : édition de blogs – Sprinks : publicité contextuelle – Programme publicitaire AdSense A partir des dia de l’Urfist de Rennes ... et ça continue • 2004 : – – – – – – Recherche localisée avec Google Local. Gmail, service de webmail gratuit Introduction en Bourse, envolée boursière Picasa, gestion des photos numériques Google Desktop, indexation des disques durs Novembre : doublement de l’index : de 4,3 milliards à 8,1 millards de pages – Google Scholar • 2005 : – Lancement de : Google Video, Google Maps, Google Earth, Google Talk – Annonce de Google Print et de la numérisation des livres – Augmentation de l’action Google de 117 % en un an – Fin 2005 : 1 milliard de requêtes journalières ! A partir des dia de l’Urfist de Rennes ... et encore • 2006 : – Lancement de Google.cn en Chine, avec une censure des résultats – Rachat de Writely, qui deviendra Google Docs & Spreadsheets en octobre – Lancement de plusieurs applications : Google Calendar, Co-Op, Trends, Apps... – Automne : Google News Archives, rachat de You Tube • 2007 : – Rachat de DoubleClick, pour $ 3,1 Mds ; – Automne : 1 million de livres numérisés, 27 partenaires pour Google Books • 2008 : – Mars : annonce de Google Health, le dossier médical personnel en ligne – Juin : partenariat avec Yahoo pour le partage du marché publicitaire – Juillet : Google a70 % du trafic aux USA, 82 % en France – Septembre : lancement du navigateur Google Chrome A partir des dia de l’Urfist de Rennes • 2009 : etc... – Février : lancement de Google Latitude, service de géolocalisation sur téléphone mobile – Mai : lancement de Google Wave, plateforme centralisée de communication – Septembre : lancement de SideWiki – Octobre : • Partenariat avec Twitter, indexation des tweets • lancement de Google Social Search, moteur de recherche social – Novembre : • Lancement de Google DashBoard ... • • • • .... Dernières annonces en date (mai 2010) relooking de Google (léger) Google e-book store (cet été ?) .... A partir des dia de l’Urfist de Rennes ... Bref Innovations + rachats + marketing ⇒ Du PageRank au « PageBank » • Publicité = 97% de son CA => régie publicitaire • dernier trimestre 09 : 5,9 Mrds $ de revenus • Des réserves de trésorerie au plus haut : 22 Mrds $ Hégémonie de google sur le marché des moteurs => recettes publicitaires imporantes A partir des dia de l’Urfist de Rennes Une liste à pub • En Europe, 8 requêtes sur 10 passent par Google • Usages : utilisation des 1er résultats • Illusion d’infini : affiche des millions de résultats en réalité inacessibles (blocage avant les 1000 résultats) • Aspect tautologique : les 1er résultats toujours renforcés ...et mes traces de navigation ? • Conservation des requêtes (Cf google trends, Dashboard) et cookies Google une régie publicitaire Premium SponsorShip (CPM) Adwords Select (CPC Résultats du « page rank » QuickTimeᆰ et un dホcompresseur BMP sont requis pour visionner cete image. Golden Triangle http://eyetools.com/research_google_eyetracking_heatmap.html Comprendre Google Voir google pour ce qu’il est : - pas un outil magique (« I’m feeling lucky ») - pas le diable (« don’t be evil ») => mais un média Documents Alimente Créer des médias adaptés à chacun. Publics Internet E-services dans les nuages Début OS en ligne (cf android) Doc électro Doc papier BdD Page web liens news blog forum mail microblogging s ag e im ne w s bl og s al er te cu st om sc ho la vi r dé o liv re s ca rte W eb Outils de Recherche Les axes de developpement du média google • Paradigme du flux vs. paradigme du stock • Economie de l’attention vs. économie de la rareté Paradigme du flux Documents • Web • Numérisation • Tri du web • Numérisation de masse • Crowdsourcing The machine is us/ing us Médias ciblés pour un public Livraison Sources Public Paradigme du stock Web2.0 Participation des foules à : • La correction de pages • De bugs • D’amélioration de services • ... alimentation Economie de l’attention • Loi de Paréto / loi de puissance (20 / 80) • économie de la rareté : rareté de l’offre, pression de la demande => coût du produit qui monte • La longue traîne : c’est l’addition de produits qui se vendent peu => rendre chaque chose disponible => aider à la trouver Popularité 20% des produits font 80% des ventes La longue traîne Produits ⇒ Rareté de la demande ⇒ Economie de l’attention ⇒ Captation de la demande, par la porte d’entrée « moteur de recherche » ... Et nous ...Et nos documents dans tout ça ? • Que deviennent les documents, leurs relations, leur « vie sociale » ? • Comment cet entonnoir redéfinit-il les règles du jeu de l'usage de l'information, et donc finalement de la production des documents ? => Etudier les multiples impacts de son existence sur la sphère informationnelle. Trouver les axes d'analyse qui partent des pratiques des usagers, du petit bout de l'entonnoir. La notion de « flou » comme fil rouge • méconnaissance des outils de recherche tend à objectiver les résultats fournis par Google. => Phénomène lié à l'intelligibilité des typologies et techniques documentaires, des techniques (algorithmiques) stochastiques et à la surcharge informationnelle. • des usagers désorientés par la déconstruction/reconstruction de leur univers documentaire => En cause la versatilité des services, des sources, des interfaces d'interrogation, rythmée par les rachats et les fusions d'entreprises. Quel flou ? • Flou cognitif (perte d’intelligibilité) • Flou sémiotique (perte de repères) ⇒ Différentes situations de flou Le flou chez les étudiants (Brigitte Simonot) • un public acculturées aux moteurs de recherche placés dans une situation d’acquisition de méthodologie de travail • Position hégémonique de Google, plébiscité pour sa facilité d’usage et son côté intuitif • le recours fréquent aux moteurs n’amène pas les étudiants à questionner les fondements d’une démarche informationnelle aboutie et n’améliore pas leurs connaissances infodocumentaires • Il leur donne surtout une illusion d’autonomie, entretenue par un manque d’intelligibilité des outils de recherche et des ressources documentaires. • => formations pour mieux gérer, évaluer et maîtriser la densité d'information, acquérir une meilleure autonomie et ne pas laisser le moteur régler la sélection des sources à leur place. Le flou chez les journalistes (Nicolas Pélissier et Mamadou Diouma Diallo) • Public de spécialistes de l’information • Ont fait la part belle à google dans leur colonnes • montée en puissance des sources électroniques par rapport aux sources traditionnelles – orales et imprimées – dans cette profession • des pratiques d’enquêtes de plus en plus sédentaires où le réseau prend une part grandissante (place de choix pour Google) • ces professionnels de l’information semblent prendre peu de recul par rapport à leurs usages du moteur. => Les formations des journalistes devraient prendre en compte cet aspect pour doter les futurs professionnels d’éléments méthodologiques et éthiques plus poussés La question de formation pour répondre au flou (Alexandre Serres et Olivier Ledeuf) • Une formation aux outils de recherche doit s'appuyer plus largement sur le développement de la culture informationnelle • Les auteurs relèvent plusieurs « confusions sémantiques » induites par les moteurs qui participent à un « brouillage » des notions infodocumentaires. – Confusion entre les différentes approches de la pertinence : pertinence topicale (relevance), pertinence-système, pertinence-utilisateur. – Confusion entre mesures d’audience et influence. – Confusion enfin entre autorité et popularité. • Face aux enjeux sociopolitiques soulevés les moteurs de recherche => la mise en œuvre d’un véritable travail de réflexion sur la didactique de l’information. Le flou dans la machine (Olivier Ertzscheid, Gabriel Gallezot et Eric Boutin) • de l’origine "scientométriques" du PageRank™ à son opacité (la boîte noire) • Instrumentalisation du concept de pertinence par le moteur et son détournement au profit d’une logique marchande • Des situations de flou et d’ambigüité s’installent, comprises entre une vision amoindrie de la réalité documentaire et une fuzzy search contrôlée – L’usager profane « decouvre » plus qui ne « recherche » – L’usager expert doit accepté l’aléatoire, la fortuité, la serendipité • les usagers ont ou n'ont pas la possibilité ou la capacité de subjectiver leur recherche, du moins ne savent pas ou peu se défaire de l' « objectivation » imposée par Google • => aspect didactique et heuristique de relevance et de la sérendipité pour combatre ce flou Le flou de l’interface (Jacques Araszkiewiez) • Analyse sémiologique de la page d’accueil • Le sujet est avaler par l’interface, par la “one box” : “le grand a-valeur” => processus de désubjectivation du dispositif socio-technique => Avec le web les médias, comme dispositifs, ne sont plus seulement une représentation métaphorique du monde mais métonymique, jettant en cela un flou sur notre réel. Le flou du discours (Céline Lacroix et Paul Rasse) • Un discours qui oscille entre culture d’entreprise et valeurs culturelles universelles • Le discours de Google s’appuie à la fois sur des valeurs politiques (ie. la démocratie) et économiques dont il joue à contre pied pour finalement mettre en exergue deux sentiments : la croyance et la confiance, qui sont dès lors érigées en valeurs => le discours affiché sur le site de Google procède d’une rhétorique publicitaire masquée faite de glissements de sens, un flou sémiotique bien entretenu Le flou dans l’avenir (Cory Doctorow) • Un nouvelle de SF • Comment se faire Engooglés • Sur les dérives possibles des informations détenues et leurs utilisations • Relations fictives entre le DHS (département of Homeland Security) et Google • “évaluation” des individus à la douane des aéroports par la publicité contextuelle autour de leur documents (... puis dérives succesives) ... En guise de conclusion Trop de google ? Attention aux associations symbiotiques Vos questions ?