Search Study Round 2
Transcription
Search Study Round 2
Sécurité des moteurs de recherche Internet – Mise à jour 11 décembre 2006 Ben Edelman Advisor to McAfee SiteAdvisor Hannah Rosenbaum Research Analyst, McAfee SiteAdvisor Pour obtenir une version Web de ce document avec des liens et des graphiques supplémentaires, reportez-vous à http://www.siteadvisor.com/studies/search_safety_dec2006.html. Résumé En mai 2006, McAfee publiait une étude comparative de la sécurité des principaux moteurs de recherche. Par le présent rapport, nous la mettons à jour en apportant de nouvelles données et en approfondissant l’analyse des types spécifiques de menaces liées aux résultats des moteurs de recherche. Pour y comparer la sécurité des principaux moteurs de recherche, nous nous basons sur des évaluations McAfee SiteAdvisor automatisées. Ces recherches confirment que les principaux moteurs présentent une sécurité similaire à celles des sites vers lesquels ils pointent. Toutefois, AOL, au lieu de MSN, est le moteur le plus sûr et Yahoo!, à la place d’Ask, est le plus risqué. Si leurs résultats sont sponsorisés, ils sont beaucoup moins sûrs. Même si les utilisateurs des moteurs sont lourdement exposés aux téléchargements dangereux, aux risques liés aux navigateurs et aux fraudes, la principale menace reste les comportements peu recommandables par e-mail. Principales conclusions Aux Etats-Unis, les 5 principaux moteurs de recherche (pourcentage d’utilisation : 91 %) proposent tous quelques résultats dangereux. AOL donne les résultats les plus sûrs avec 3,6 % des résultats notés rouges1 ou jaunes2 par McAfee SiteAdvisor. Avec 5,1 %, Yahoo! renvoie le plus de résultats notés rouges ou jaunes. En moyenne, 4,4 % des résultats de recherche pointent vers des sites à risque. Si les résultats sont sponsorisés, 8 % sont notés rouges ou jaunes (pratiquement trois fois moins dans le cas contraire). En particulier, les sites de fraude se retrouvent à une fréquence supérieure dans les résultats sponsorisés. Par ailleurs, 41,4 % des sites rouges ou jaunes montrent de mauvaises pratiques par e-mail, 24,5 % contiennent des fichiers de téléchargement risqués, 26,8 % sont des sites de fraude, 32,3 % pointent vers d'autres sites à risque et 3 % impliquent des risques liés aux navigateurs. De nombreux sites présentent plusieurs types de risques. % de sites rouges et jaunes2... par moteur de recherche Pourcentage des résultats de recherche Par type de résultat Pourcentage des résultats de recherche 1 Les sites notés rouges n'ont pas réussi les tests de sécurité de McAfee SiteAdvisor. Ils incluent notamment des sites depuis lesquels sont distribués des logiciels espions, sont envoyés de nombreux spams et sont apportés des changements non autorisés à l'ordinateur d'un utilisateur. 2 Les sites notés jaunes impliquent d'importants conseils basés sur les tests de McAfee SiteAdvisor. Ils incluent notamment des sites depuis lesquels sont envoyés beaucoup de non-spams, sont affichées de nombreuses fenêtres instantanées ou sont proposés à l'utilisateur des changements de paramétrage du navigateur. Les expressions de recherche pour adultes sont deux fois plus dangereuses que pour mineurs. Les sites dangereux dépassent 90 % de résultats pour certains mots-clés à risque. Les mots-clés particulièrement dangereux sont "bearshare", "free screensavers" et "free ringtones". Introduction Les moteurs de recherche sont devenus la principale passerelle vers Internet. Ainsi, près de 80 % des visites de pages Web sont issues de moteurs de recherche. Même si les moteurs offrent souvent la manière la plus rapide de naviguer sur le Web, ils ne sont pas forcément les plus sûrs. En général, les classements des moteurs ne se concentrent pas explicitement sur la sécurité des sites Web. Toutefois, les utilisateurs se reposent souvent dessus pour s'en faire une idée. Plus d'un tiers considèrent que les sociétés classées parmi les premiers résultats de recherche sont parmi les principales de leur secteur. Ils associent à tort la confiance au classement des résultats de recherche. Les classements ne reflètent pas la sécurité. À moins de choisir des sites Web familiers en qui ils ont confiance du fait d'une expérience préalable, les utilisateurs risquent fort de s'exposer à de nombreuses menaces. Méthodologie Nous comparons la sécurité de cinq moteurs de recherche : Google, Yahoo!, MSN, AOL et Ask. Pour ce faire, nous compilons une liste d'environ 2 500 mots-clés populaires tirés des listes de recherche courantes de Google Zeitgeist, Yahoo!, AOL, Ask, Lycos, Wordtracker, Hitwise et autres sources du secteur. Dans chacun des cinq moteurs, nous évaluons les cinq premières pages de résultats de chaque mot-clé. Nous analysons la sécurité du site en fonction de la position et du type de résultat (sponsorisé ou non). Nos évaluations de sécurité des sites sont tirées de la base de données de sécurité Web de McAfee SiteAdvisor (7,9 millions de sites Web, soit plus de 95 % de l'ensemble du trafic). Depuis notre précédente analyse de mai 2006, McAfee SiteAdvisor a augmenté la couverture des sites Web, des téléchargements et des risques liés aux navigateurs (de 3 à 7,9 millions de sites). Nous analysons la sécurité des sites Web à l'aide des évaluations générales de McAfee SiteAdvisor et des évaluations de comportements spécifiques : risques liés aux navigateurs, e-mails, téléchargements, fraudes, liens vers d'autres sites et désagréments (par exemple, des fenêtres instantanées). Analyse Comparaison des moteurs de recherche Même si tous les moteurs de recherche renvoient des résultats peu sûrs, les listes de Yahoo! sont particulièrement risquées. Dans notre analyse, 5,1 % des résultats de Yahoo! sont notés rouges ou jaunes. AOL renvoie les résultats les plus sûrs, avec 3,6 % notés rouges ou jaunes. En général, 4,4% des résultats sont notés rouges (2,6 %) ou jaunes (1,7 %). Part de marché de recherche Google : 49,6 % Yahoo! : 23,9 % MSN : 8,8 % AOL : 6,2 % Ask : 2,8 % Pourcentage de résultats rouges et jaunes par moteur de recherche Depuis la publication de notre étude sur les moteurs de recherche en mai 2006, le pourcentage de sites rouges et jaunes dans les résultats est passé de 5 à 4,4 %. Google, AOL et Ask renvoient maintenant des résultats plus sûrs, tandis que Yahoo! et MSN sont à l’origine de résultats plus risqués. Plusieurs facteurs peuvent contribuer à ces changements. Par exemple, certains moteurs de recherche modifient leurs algorithmes de classement. D'autres modifient les plates-formes publicitaires. Parallèlement, nous actualisons notre liste de mots-clés pour mieux refléter les expressions de recherche les plus courantes et les plus récentes. Les classements relatifs des moteurs de recherche ont également évolué. AOL, au lieu de MSN, est le moteur le plus sûr et Yahoo!, à la place d’Ask, est le plus risqué. La baisse de sécurité de MSN est probablement due à l'expansion de son programme de recherche payante, qui était en cours (avec un nombre de publicités inhabituellement bas) pendant la collecte de données de notre précédent article. Le pourcentage de sites rouges et jaunes dans les résultats sponsorisés de MSN est passé de 6,3 en mai à 10,7 % en novembre. Evolution depuis mai : Google () Yahoo () MSN () AOL () Ask () Novembre 2006 4.2% 5.1% 4.6% 3.6% 4.2% Organic () 3.0% Sponsored () 8.0% plus sûr depuis la dernière étude Mai 2006 5.3% 4.3% 3.9% 5.3% 6.1% 3.1% 8.5% moins sûr depuis la dernière étude Résultats en terme de sécurité : risques, e-mails, téléchargements, fraudes et liens Les utilisateurs de moteurs de recherche sont exposés à plusieurs types de risques. Parmi les résultats notés rouges ou jaunes, 24,5 % sont dus à des téléchargements risqués, 41,4 % à de mauvaises pratiques par e-mail, 26,8 % à des fraudes et 31,2 % à des liens vers d'autres sites avec ces pratiques. Par ailleurs, 3 % des résultats de recherche rouges et jaunes impliquent des risques liés aux navigateurs, notamment des menaces sérieuses susceptibles d'endommager le PC d'un utilisateur par simple visite d'un site. La récente implémentation dans Google d'une page d'avertissement d'interstitiel pour certains sites améliore légèrement la sécurité des résultats de Google. Ce développement récent représente un effort de Google pour éloigner les utilisateurs des sites dangereux mais les avertissements ne sont pas fiables (ils n’apparaissent que dans 18 % des résultats avec des risques liés aux navigateurs). Google Yahoo! MSN AOL Ask En général Google Yahoo! MSN AOL Ask En général % de résultats de recherche notés rouges/jaunes selon le risque de sécurité Téléchargements E-mails Risques Fraudes 1.1% 1.9% 0.13% 0.9% 1.0% 2.0% 0.09% 2.1% 1.3% 1.6% 0.09% 1.2% 1.1% 2.0% 0.17% 0.5% 1.0% 1.6% 0.17% 1.2% 1.1% 1.8% 0.13% 1.2% % de résultats de recherche rouges/jaunes selon le risque de sécurité Téléchargements E-mails Risques Fraudes 26.2% 45.2% 3.1% 21.4% 19.6% 39.2% 1.8% 41.2% 28.3% 34.8% 2.0% 26.1% 30.6% 55.6% 4.7% 13.9% 23.8% 38.1% 4.0% 28.6% 25.0% 41.4% 3.0% 26.8% Liens 1.6% 1.6% 1.3% 1.2% 1.4% 1.4% Liens 38.1% 31.4% 28.3% 33.3% 33.3% 32.3% Ces tableaux confirment que les utilisateurs sont confrontés à des risques différents selon les moteurs de recherche. Les résultats de Yahoo impliquent deux fois plus de fraudes que les autres alors que les meilleurs résultats dans ce domaine reviennent à AOL (grâce aux évaluations de fraude de SiteAdvisor, les utilisateurs sont notamment informés des pratiques de facturation, offres ou revendications trompeuses). Toutefois, AOL n'est pas systématiquement plus sûr : les risques et les expéditeurs d'e-mails en masse sont plus présents parmi les résultats recensés par AOL. Pourcentage de résultats rouges et jaunes par moteur de recherche Résultats sponsorisés ou non Selon notre analyse, les résultats sponsorisés (publicité payante) des moteurs de recherche sont environ trois fois plus susceptibles de mener à des sites rouges et jaunes. Ce fait se reflète bien sur les algorithmes de classement de résultats non sponsorisés. Toutefois, il indique que les moteurs reçoivent des paiements substantiels pour les sites à risque. En permettant aux sites à risque d'acheter un positionnement prédominant dans les résultats de recherche, les moteurs les aident à atteindre les utilisateurs peu suspicieux, voire à les léser. En 2006, la publicité de recherche va dépasser les 16 milliards de dollars. En supposant que les prix des publicités de sites peu sûrs soient similaires aux autres (approximation raisonnable à notre avis), les moteurs de recherche gagneront environ 1,28 milliards de dollars chaque année pour les activités américaines (en dirigeant les utilisateurs vers des sites risqués). Les sites rouges et jaunes apparaissent presque trois fois plus dans des résultats sponsorisés. MSN présente le plus fort pourcentage de résultats sponsorisés à risque (10,7 %), tandis que les résultats sponsorisés d'Ask sont les plus sûrs (6,5 %). Pourcentage de résultats sponsorisés rouges et jaunes par moteur de recherche Résultats sponsorisés favorisant les sites de fraude Les résultats sponsorisés contiennent notamment un pourcentage plus élevé de sites de fraude. Parmi eux, 4,1 % sont notés rouges ou jaunes dans ce domaine par rapport à 0,1 % des résultats non sponsorisés. Les sites de fraude affichent un contenu fictif (pratiques de facturation, offres et revendications trompeuses). Ils peuvent par exemple facturer des téléchargements gratuits, facturer la participation à la loterie gratuite pour cartes vertes ou déguiser des opérations pyramidales en opportunités lucratives de travail à domicile. Les sites de fraude apparaissent souvent dans les résultats sponsorisés malgré les directives publicitaires des moteurs interdisant le contenu trompeur. Pour plus d'informations, reportez-vous à l’article False and Deceptive Pay-Per-Click Ads de Ben Edelman. Les sites de fraude notés rouges et jaunes apparaissent presque entièrement dans les résultats sponsorisés. L'utilisation du mot "gratuit" Pourcentage de résultats rouges et jaunes par expression de recherche contenant le mot "free" Les recherches courantes sur le mot "free" sont particulièrement susceptibles de diriger les utilisateurs vers des sites peu recommandables. Pour ces recherches, 14,5 % des résultats pointent vers des sites notés jaunes ou rouges. Les sites Web qui achètent le mot de recherche "free" utilisent diverses stratégies pour piéger les utilisateurs. Les téléchargements "gratuits" sont souvent liés à des programmes indésirables, en particulier des logiciels publicitaires, des barres d'outils ou des logiciels de suivi. Les sites proposant des services "gratuits" (par exemple, des sonneries ou des vérifications de solvabilité) présentent souvent des revendications trompeuses, cachent des mentions d'honoraires en petites lettres ou imposent d'autres pratiques de facturation trompeuses. D'autres s’attaquent aux consommateurs naïfs en facturant des produits facilement accessibles ailleurs gratuitement. Par exemple, certains sites facturent le navigateur gratuit Firefox, sur la base de promesses suspectes de support technique ou de service clientèle. En outre, les sites communiquent souvent les adresses e-mail des utilisateurs à des tiers en prétendant offrir des produits (par exemple, des iPod ou des téléviseurs à écran plat). Ils leur imposent ainsi des centaines d'e-mails par semaine. Sécurité par page La sécurité des résultats de recherche reste à peu près constante sur les cinq premières pages de résultats, d'où un manque de corrélation entre le classement du résultat et la sécurité du site. Les premiers résultats de la page, sélectionnés par 62 % des utilisateurs, ne sont pas plus sûrs que les résultats des pages suivantes. En conséquence, le fait de se contenter des premiers résultats de la recherche ne garantit pas la sécurité des internautes. Pourcentage de résultats rouges et jaunes par page de résultats Sécurité par position Contrairement à la sécurité des résultats sponsorisés, celle des résultats non sponsorisés est cohérente avec la position. Selon nos tests, le premier résultat sponsorisé de Google, en haut de page, est certainement plus sûr que les positions 2 et 3. Parmi les résultats sponsorisés de Google répertoriés à droite de la page, les deux premiers sont moins risqués que les suivants. Nous avons remarqué que de nombreuses publicités de Google en première position sont en fait des publicités gratuites sans but lucratif passant par Google.org. Les caractéristiques de ces publicités expliquent la sécurité relative de la première position dans Google : elles ont tendance à promouvoir des sites sûrs (sans logiciels espions, fraudes ou éléments similaires) et à être en première place car leurs auteurs n'ont pas à payer Google. Résultats de Google par position De type non sponsorisé Position 1 2 3 4 5 6 7 8 9 10 % de sites rouges/jaunes 3.1% 3.2% 3.5% 2.9% 3.2% 2.9% 3.0% 3.1% 3.1% 3.2% De type sponsorisé - Haut de page Position % de sites rouges/jaunes 1 6.2% 2 9.5% 3 9.0% De type sponsorisé - A droite de la page Position % de sites rouges/jaunes 1 5.2% 2 6.2% 3 8.4% 4 9.1% 5 8.9% 6 8.3% 7 7.4% 8 7.7% Analyse de catégories Parmi les expressions de recherche de Google Zeitgeist analysées, la catégorie la plus dangereuse est celle des jouets technologiques pour laquelle 23,3 % des résultats sont notés rouges ou jaunes par McAfee SiteAdvisor. Elle inclut "iPod nano", "mp3 music downloads" et "winmx" (des expressions qui mènent souvent à des fraudes et d'autres pratiques suspectes). En général, les catégories de Google Zeitgeist liées à la musique et à la technologie renvoient les plus forts pourcentages de résultats à risque. Les risques pour ces catégories comprennent principalement des téléchargements dangereux et des fraudes basées sur la facturation de logiciels gratuits. Les cinq catégories Google Zeitgeist les plus dangereuses comprennent : Catégorie Google Zeitgeist Jouets technologiques Logiciels populaires Musique numérique Requêtes technologiques Chanteurs célèbres % de résultats rouges/jaunes 23.3% 20.0% 19.7% 18.6% 15.3% Les recherches sur les célébrités présentent souvent de nombreux risques. Nous avons découvert plusieurs sites dangereux dans la catégorie des chanteurs célèbres (15,3 %) comme Usher et Nelly. Il en va de même dans la catégorie des femmes célèbres (10,5 %) comme Lindsay Lohan et Paris Hilton. Les résultats dangereux sont également très présents dans les expressions de recherche sportive (11,3 %) comme "Real Madrid" et "cricket". Il en va de même dans les mots-clés préférés d'enfants (6,7 %) comme "Winnie the Pooh" et "Tweety". En revanche, les mots-clés de la catégorie Web 2 de Google Zeitgeist comme "wikipedia" et "youtube" ne contiennent pas de résultats dangereux. Parmi les autres catégories relativement sûres figurent le voyage d'été (0,8 %) (exemples d'expressions : "Expedia" et "Travelocity") et les sorties week-end (0,4 %) (exemples d'expressions : "USPS" et "Home Depot"). Analyse de mots-clés particuliers Selon nos tests, le mot-clé particulier le plus dangereux (sur tous les moteurs de recherche) est bearshare (53,3 % de résultats notés rouges ou jaunes). Bearshare est un programme gratuit de partage de fichiers qui installe des logiciels publicitaires (selon nos tests). Il est également un mot-clé à risque car de nombreux sites facturent l'accès à ce programme gratuit. Le pourcentage maximum de résultats rouges et jaunes est 90,9 % lors de la recherche de "rotten.com" sur MSN. Dix expressions de recherche les plus dangereuses : Expression de recherche 1 2 3 4 5 6 7 8 9 10 bearshare rotten.com free screensavers winmx screensavers limewire kazaa free ringtones ringtones lime wire % de résultats rouges/jaunes 53.3% 53.1% 53.0% 52.0% 48.2% 46.2% 45.8% 44.3% 43.8% 42.7% Expressions de recherche pour adultes ou mineurs Nos tests suggèrent que les expressions de recherche pour adultes sont deux fois plus susceptibles de mener à des résultats peu sûrs. A des fins d'enquête, nous avons constitué un ensemble de 142 mots-clés de recherche pour adultes. Pour ces mots-clés, 8 % des résultats sont notés rouges ou jaunes (4,1 % en cas d'expressions pour mineurs). Les mots-clés pour adultes ont renvoyé un pourcentage supérieur de sites avec des risques liés aux navigateurs et de mauvaises pratiques par e-mail. Les expressions de recherche pour adultes sont deux fois plus susceptibles de mener à des résultats dangereux. Discussion Reste à voir si les classements des moteurs de recherche vont finalement évoluer pour tenir compte de la sécurité des sites. Sur le moteur de Google, les classements des publicités incluent déjà une notion de "qualité de la page cible" et les directives publicitaires mentionnent plusieurs facteurs jugés justes (par exemple, éviter l'envoi d'un nombre excessif d'e-mails aux utilisateurs et d'obstacles liés à l'obtention d'un produit gratuit). Pourtant, nous restons alertés par le fait que tant de publicitaires de Google continuent à promouvoir des services jugés frauduleux en promettant à tort un élément "gratuit" ou en facturant un produit accessible ailleurs à tous gratuitement. Plus généralement, les moteurs de recherche tirent profit des résultats sponsorisés des fraudeurs et donc les incite à conserver des sites aux résultats peu sûrs. Des directives publicitaires strictes et un filtrage rigoureux peuvent réduire les revenus obtenus à court terme par les moteurs de recherche mais leur profiter au final. Si les liens sponsorisés devenaient plus sûrs que ceux non sponsorisés, les utilisateurs cliqueraient plus souvent sur les premiers et les publicitaires augmenteraient en conséquence leurs dépenses de recherche payante. L’anonymat qu’autorise le Web pose un problème que les moteurs peuvent tout à fait résoudre. En cas de passivité, les fraudeurs peuvent manipuler le marché, tromper les consommateurs et apparemment s'en sortir sans problèmes. Toutefois, les moteurs de recherche peuvent permettre d’éviter les sites dangereux en restreignant les publicitaires et en interdisant les publicités trompeuses et malveillantes. Parallèlement, les utilisateurs engagés peuvent tirer parti de ces avantages en installant le plug-in de navigateur McAfee SiteAdvisor, qui annote automatiquement les résultats de recherche et indique son évaluation de sécurité. Certains utilisateurs sont restés naïfs quant à la sécurité Web. Ils cliquent sur des options, envoient leurs adresses email et effectuent des téléchargements gratuits sans réaliser les conséquences, jusqu'à ce que les dommages se concrétisent. En tant qu'acteurs de la sécurité Web, nous prenons cela à cœur, car leur expérience en ligne sera pire au final que si l’environnement était plus sécurisé. D’autres cherchent à éviter les dangers du Web en limitant leurs activités en ligne : ils se contentent de sites familiers, ne donnent jamais leurs adresses e-mail et ne téléchargent jamais de nouveaux programmes. Le résultat est tout aussi désastreux : ces précautions les empêchent d'explorer le Web et de profiter des nombreux sites utiles et divertissants. Nous devons pouvoir naviguer en toute sécurité, sans préoccupation inutile. Nous espérons que les auteurs de moteurs de recherche prendront des mesures pour améliorer la sécurité des résultats et ainsi simplifier l'activité des utilisateurs. Autres graphiques et tableaux Analysis of Organic Results by Search Engine et Analysis of Sponsored Results by Search Engine Analysis by Zeitgeist Keyword Group (catégories de mots-clé les plus sûres et les plus risquées) Analysis by Individual Keyword Ressources Forrester to Marketers: Let Age Define Your Buy - ClickZ False and Deceptive Pay-Per-Click Ads - Ben Edelman Google Revenue to Exceed $10 Billion in 2007 - eMarketer How Consumers Find Web Sites In 2006 - Forrester The Philanthropic Arm of Google - Google Search Engine User Behavior Study - iProspect Search Engine Market Share - Nielsen/NetRatings Google AdWords Landing Page Quality Ranking Initiated - Search Engine Journal Directives publicitaires des moteurs de recherche Google – Consignes de rédaction Google AdWords Consignes relatives aux pages de destination et à la qualité des sites de Google AdWords Inside AdWords: Landing Page Quality Update Yahoo! - Sponsored Search Listing Guidelines MSN - AdCenter Search Ads Content Guidelines AOL - Ad Specs - Policies and Guidelines Ask - Sponsored Listings - Guidelines Outil de sécurité Web SiteAdvisor siteadvisor.com