Search Study Round 2

Transcription

Search Study Round 2
Sécurité des moteurs de recherche Internet –
Mise à jour
11 décembre 2006
Ben Edelman
Advisor to McAfee SiteAdvisor
Hannah Rosenbaum
Research Analyst, McAfee SiteAdvisor
Pour obtenir une version Web de ce document avec des liens et des
graphiques supplémentaires,
reportez-vous à http://www.siteadvisor.com/studies/search_safety_dec2006.html.
Résumé
En mai 2006, McAfee publiait une étude comparative de la sécurité des principaux moteurs de recherche. Par le présent
rapport, nous la mettons à jour en apportant de nouvelles données et en approfondissant l’analyse des types spécifiques de
menaces liées aux résultats des moteurs de recherche.
Pour y comparer la sécurité des principaux moteurs de recherche, nous nous basons sur des évaluations McAfee
SiteAdvisor automatisées. Ces recherches confirment que les principaux moteurs présentent une sécurité similaire à celles
des sites vers lesquels ils pointent. Toutefois, AOL, au lieu de MSN, est le moteur le plus sûr et Yahoo!, à la place d’Ask,
est le plus risqué. Si leurs résultats sont sponsorisés, ils sont beaucoup moins sûrs. Même si les utilisateurs des moteurs
sont lourdement exposés aux téléchargements dangereux, aux risques liés aux navigateurs et aux fraudes, la principale
menace reste les comportements peu recommandables par e-mail.
Principales conclusions
Aux Etats-Unis, les 5 principaux moteurs de recherche
(pourcentage d’utilisation : 91 %) proposent tous quelques
résultats dangereux.
AOL donne les résultats les plus sûrs avec 3,6 % des résultats
notés rouges1 ou jaunes2 par McAfee SiteAdvisor. Avec 5,1 %,
Yahoo! renvoie le plus de résultats notés rouges ou jaunes. En
moyenne, 4,4 % des résultats de recherche pointent vers des
sites à risque.
Si les résultats sont sponsorisés, 8 % sont notés rouges ou jaunes
(pratiquement trois fois moins dans le cas contraire). En
particulier, les sites de fraude se retrouvent à une fréquence
supérieure dans les résultats sponsorisés.
Par ailleurs, 41,4 % des sites rouges ou jaunes montrent de
mauvaises pratiques par e-mail, 24,5 % contiennent des fichiers
de téléchargement risqués, 26,8 % sont des sites de fraude,
32,3 % pointent vers d'autres sites à risque et 3 % impliquent
des risques liés aux navigateurs. De nombreux sites présentent
plusieurs types de risques.
% de sites rouges et jaunes2...
par moteur de recherche
Pourcentage des résultats de recherche
Par type de résultat
Pourcentage des résultats de recherche
1
Les sites notés rouges n'ont pas réussi les tests de sécurité de McAfee SiteAdvisor. Ils incluent notamment des sites depuis lesquels sont
distribués des logiciels espions, sont envoyés de nombreux spams et sont apportés des changements non autorisés à l'ordinateur d'un
utilisateur.
2
Les sites notés jaunes impliquent d'importants conseils basés sur les tests de McAfee SiteAdvisor. Ils incluent notamment des sites depuis
lesquels sont envoyés beaucoup de non-spams, sont affichées de nombreuses fenêtres instantanées ou sont proposés à l'utilisateur des
changements de paramétrage du navigateur.
Les expressions de recherche pour adultes sont deux fois plus dangereuses que pour mineurs.
Les sites dangereux dépassent 90 % de résultats pour certains mots-clés à risque. Les mots-clés particulièrement
dangereux sont "bearshare", "free screensavers" et "free ringtones".
Introduction
Les moteurs de recherche sont devenus la principale passerelle vers Internet. Ainsi, près de 80 % des visites de pages
Web sont issues de moteurs de recherche. Même si les moteurs offrent souvent la manière la plus rapide de naviguer
sur le Web, ils ne sont pas forcément les plus sûrs.
En général, les classements des moteurs ne se concentrent pas explicitement sur la sécurité des sites Web. Toutefois,
les utilisateurs se reposent souvent dessus pour s'en faire une idée. Plus d'un tiers considèrent que les sociétés
classées parmi les premiers résultats de recherche sont parmi les principales de leur secteur. Ils associent à tort la
confiance au classement des résultats de recherche. Les classements ne reflètent pas la sécurité. À moins de choisir
des sites Web familiers en qui ils ont confiance du fait d'une expérience préalable, les utilisateurs risquent fort de
s'exposer à de nombreuses menaces.
Méthodologie
Nous comparons la sécurité de cinq moteurs de recherche : Google, Yahoo!, MSN, AOL et Ask. Pour ce faire, nous
compilons une liste d'environ 2 500 mots-clés populaires tirés des listes de recherche courantes de Google Zeitgeist,
Yahoo!, AOL, Ask, Lycos, Wordtracker, Hitwise et autres sources du secteur. Dans chacun des cinq moteurs, nous
évaluons les cinq premières pages de résultats de chaque mot-clé. Nous analysons la sécurité du site en fonction de la
position et du type de résultat (sponsorisé ou non).
Nos évaluations de sécurité des sites sont tirées de la base de données de sécurité Web de McAfee SiteAdvisor (7,9
millions de sites Web, soit plus de 95 % de l'ensemble du trafic). Depuis notre précédente analyse de mai 2006,
McAfee SiteAdvisor a augmenté la couverture des sites Web, des téléchargements et des risques liés aux navigateurs
(de 3 à 7,9 millions de sites).
Nous analysons la sécurité des sites Web à l'aide des évaluations générales de McAfee SiteAdvisor et des évaluations
de comportements spécifiques : risques liés aux navigateurs, e-mails, téléchargements, fraudes, liens vers d'autres
sites et désagréments (par exemple, des fenêtres instantanées).
Analyse
Comparaison des moteurs de recherche
Même si tous les moteurs de recherche renvoient des résultats peu sûrs, les listes de Yahoo! sont particulièrement
risquées. Dans notre analyse, 5,1 % des résultats de Yahoo! sont notés rouges ou jaunes. AOL renvoie les résultats
les plus sûrs, avec 3,6 % notés rouges ou jaunes. En général, 4,4% des résultats sont notés rouges (2,6 %) ou jaunes
(1,7 %).
Part de marché de
recherche
Google : 49,6 %
Yahoo! : 23,9 %
MSN : 8,8 %
AOL : 6,2 %
Ask : 2,8 %
Pourcentage de résultats rouges et jaunes par moteur de recherche
Depuis la publication de notre étude sur les moteurs de recherche en mai 2006, le pourcentage de sites rouges et
jaunes dans les résultats est passé de 5 à 4,4 %. Google, AOL et Ask renvoient maintenant des résultats plus sûrs,
tandis que Yahoo! et MSN sont à l’origine de résultats plus risqués. Plusieurs facteurs peuvent contribuer à ces
changements. Par exemple, certains moteurs de recherche modifient leurs algorithmes de classement. D'autres
modifient les plates-formes publicitaires. Parallèlement, nous actualisons notre liste de mots-clés pour mieux refléter
les expressions de recherche les plus courantes et les plus récentes.
Les classements relatifs des moteurs de recherche ont également évolué. AOL, au lieu de MSN, est le moteur le plus
sûr et Yahoo!, à la place d’Ask, est le plus risqué. La baisse de sécurité de MSN est probablement due à l'expansion
de son programme de recherche payante, qui était en cours (avec un nombre de publicités inhabituellement bas)
pendant la collecte de données de notre précédent article. Le pourcentage de sites rouges et jaunes dans les résultats
sponsorisés de MSN est passé de 6,3 en mai à 10,7 % en novembre.
Evolution depuis mai :
Google ()
Yahoo ()
MSN ()
AOL ()
Ask ()
Novembre 2006
4.2%
5.1%
4.6%
3.6%
4.2%
Organic ()
3.0%
Sponsored ()
8.0%
 plus sûr depuis la dernière étude
Mai 2006
5.3%
4.3%
3.9%
5.3%
6.1%
3.1%
8.5%
 moins sûr depuis la dernière étude
Résultats en terme de sécurité : risques, e-mails, téléchargements, fraudes et liens
Les utilisateurs de moteurs de recherche sont exposés à plusieurs types de risques. Parmi les résultats notés rouges ou
jaunes, 24,5 % sont dus à des téléchargements risqués, 41,4 % à de mauvaises pratiques par e-mail, 26,8 % à des
fraudes et 31,2 % à des liens vers d'autres sites avec ces pratiques. Par ailleurs, 3 % des résultats de recherche rouges
et jaunes impliquent des risques liés aux navigateurs, notamment des menaces sérieuses susceptibles d'endommager
le PC d'un utilisateur par simple visite d'un site. La récente implémentation dans Google d'une page d'avertissement
d'interstitiel pour certains sites améliore légèrement la sécurité des résultats de Google. Ce développement récent
représente un effort de Google pour éloigner les utilisateurs des sites dangereux mais les avertissements ne sont pas
fiables (ils n’apparaissent que dans 18 % des résultats avec des risques liés aux navigateurs).
Google
Yahoo!
MSN
AOL
Ask
En général
Google
Yahoo!
MSN
AOL
Ask
En général
% de résultats de recherche notés rouges/jaunes selon le risque de sécurité
Téléchargements
E-mails
Risques
Fraudes
1.1%
1.9%
0.13%
0.9%
1.0%
2.0%
0.09%
2.1%
1.3%
1.6%
0.09%
1.2%
1.1%
2.0%
0.17%
0.5%
1.0%
1.6%
0.17%
1.2%
1.1%
1.8%
0.13%
1.2%
% de résultats de recherche rouges/jaunes selon le risque de sécurité
Téléchargements
E-mails
Risques
Fraudes
26.2%
45.2%
3.1%
21.4%
19.6%
39.2%
1.8%
41.2%
28.3%
34.8%
2.0%
26.1%
30.6%
55.6%
4.7%
13.9%
23.8%
38.1%
4.0%
28.6%
25.0%
41.4%
3.0%
26.8%
Liens
1.6%
1.6%
1.3%
1.2%
1.4%
1.4%
Liens
38.1%
31.4%
28.3%
33.3%
33.3%
32.3%
Ces tableaux confirment que les utilisateurs sont confrontés à des risques différents selon les moteurs de recherche.
Les résultats de Yahoo impliquent deux fois plus de fraudes que les autres alors que les meilleurs résultats dans ce
domaine reviennent à AOL (grâce aux évaluations de fraude de SiteAdvisor, les utilisateurs sont notamment
informés des pratiques de facturation, offres ou revendications trompeuses). Toutefois, AOL n'est pas
systématiquement plus sûr : les risques et les expéditeurs d'e-mails en masse sont plus présents parmi les résultats
recensés par AOL.
Pourcentage de résultats rouges et jaunes par moteur de recherche
Résultats sponsorisés ou non
Selon notre analyse, les résultats sponsorisés (publicité payante) des moteurs de recherche sont environ trois fois plus
susceptibles de mener à des sites rouges et jaunes. Ce fait se reflète bien sur les algorithmes de classement de
résultats non sponsorisés. Toutefois, il indique que les moteurs reçoivent des paiements substantiels pour les sites à
risque. En permettant aux sites à risque d'acheter un positionnement prédominant dans les résultats de recherche, les
moteurs les aident à atteindre les utilisateurs peu suspicieux, voire à les léser. En 2006, la publicité de recherche va
dépasser les 16 milliards de dollars. En supposant que les prix des publicités de sites peu sûrs soient similaires aux
autres (approximation raisonnable à notre avis), les moteurs de recherche gagneront environ 1,28 milliards de dollars
chaque année pour les activités américaines (en dirigeant les utilisateurs vers des sites risqués).
Les sites rouges et jaunes apparaissent presque trois fois plus dans des résultats sponsorisés.
MSN présente le plus fort pourcentage de résultats sponsorisés à risque (10,7 %), tandis que les résultats sponsorisés
d'Ask sont les plus sûrs (6,5 %).
Pourcentage de résultats sponsorisés rouges et jaunes par moteur de recherche
Résultats sponsorisés favorisant les sites de fraude
Les résultats sponsorisés contiennent notamment un pourcentage plus élevé de sites de fraude. Parmi eux, 4,1 % sont
notés rouges ou jaunes dans ce domaine par rapport à 0,1 % des résultats non sponsorisés. Les sites de fraude
affichent un contenu fictif (pratiques de facturation, offres et revendications trompeuses). Ils peuvent par exemple
facturer des téléchargements gratuits, facturer la participation à la loterie gratuite pour cartes vertes ou déguiser des
opérations pyramidales en opportunités lucratives de travail à domicile. Les sites de fraude apparaissent souvent dans
les résultats sponsorisés malgré les directives publicitaires des moteurs interdisant le contenu trompeur. Pour plus
d'informations, reportez-vous à l’article False and Deceptive Pay-Per-Click Ads de Ben Edelman.
Les sites de fraude notés rouges et jaunes apparaissent presque entièrement dans les résultats sponsorisés.
L'utilisation du mot "gratuit"
Pourcentage de résultats rouges et jaunes par expression de recherche contenant le mot "free"
Les recherches courantes sur le mot "free" sont particulièrement susceptibles de diriger les utilisateurs vers des sites
peu recommandables. Pour ces recherches, 14,5 % des résultats pointent vers des sites notés jaunes ou rouges. Les
sites Web qui achètent le mot de recherche "free" utilisent diverses stratégies pour piéger les utilisateurs. Les
téléchargements "gratuits" sont souvent liés à des programmes indésirables, en particulier des logiciels publicitaires,
des barres d'outils ou des logiciels de suivi. Les sites proposant des services "gratuits" (par exemple, des sonneries ou
des vérifications de solvabilité) présentent souvent des revendications trompeuses, cachent des mentions d'honoraires
en petites lettres ou imposent d'autres pratiques de facturation trompeuses. D'autres s’attaquent aux consommateurs
naïfs en facturant des produits facilement accessibles ailleurs gratuitement. Par exemple, certains sites facturent le
navigateur gratuit Firefox, sur la base de promesses suspectes de support technique ou de service clientèle. En outre,
les sites communiquent souvent les adresses e-mail des utilisateurs à des tiers en prétendant offrir des produits (par
exemple, des iPod ou des téléviseurs à écran plat). Ils leur imposent ainsi des centaines d'e-mails par semaine.
Sécurité par page
La sécurité des résultats de recherche reste à peu près constante sur les cinq premières pages de résultats, d'où un
manque de corrélation entre le classement du résultat et la sécurité du site. Les premiers résultats de la page,
sélectionnés par 62 % des utilisateurs, ne sont pas plus sûrs que les résultats des pages suivantes. En conséquence, le
fait de se contenter des premiers résultats de la recherche ne garantit pas la sécurité des internautes.
Pourcentage de résultats rouges et jaunes par page de résultats
Sécurité par position
Contrairement à la sécurité des résultats sponsorisés, celle des résultats non sponsorisés est cohérente avec la
position. Selon nos tests, le premier résultat sponsorisé de Google, en haut de page, est certainement plus sûr que les
positions 2 et 3. Parmi les résultats sponsorisés de Google répertoriés à droite de la page, les deux premiers sont
moins risqués que les suivants. Nous avons remarqué que de nombreuses publicités de Google en première position
sont en fait des publicités gratuites sans but lucratif passant par Google.org. Les caractéristiques de ces publicités
expliquent la sécurité relative de la première position dans Google : elles ont tendance à promouvoir des sites sûrs
(sans logiciels espions, fraudes ou éléments similaires) et à être en première place car leurs auteurs n'ont pas à payer
Google.
Résultats de Google par position
De type non sponsorisé
Position
1
2
3
4
5
6
7
8
9
10
% de sites
rouges/jaunes
3.1%
3.2%
3.5%
2.9%
3.2%
2.9%
3.0%
3.1%
3.1%
3.2%
De type sponsorisé - Haut de
page
Position
% de sites
rouges/jaunes
1
6.2%
2
9.5%
3
9.0%
De type sponsorisé - A droite de
la page
Position
% de sites
rouges/jaunes
1
5.2%
2
6.2%
3
8.4%
4
9.1%
5
8.9%
6
8.3%
7
7.4%
8
7.7%
Analyse de catégories
Parmi les expressions de recherche de Google Zeitgeist analysées, la catégorie la plus dangereuse est celle des jouets
technologiques pour laquelle 23,3 % des résultats sont notés rouges ou jaunes par McAfee SiteAdvisor. Elle inclut
"iPod nano", "mp3 music downloads" et "winmx" (des expressions qui mènent souvent à des fraudes et d'autres
pratiques suspectes). En général, les catégories de Google Zeitgeist liées à la musique et à la technologie renvoient
les plus forts pourcentages de résultats à risque. Les risques pour ces catégories comprennent principalement des
téléchargements dangereux et des fraudes basées sur la facturation de logiciels gratuits.
Les cinq catégories Google Zeitgeist les plus dangereuses comprennent :
Catégorie Google Zeitgeist
Jouets technologiques
Logiciels populaires
Musique numérique
Requêtes technologiques
Chanteurs célèbres
% de résultats
rouges/jaunes
23.3%
20.0%
19.7%
18.6%
15.3%
Les recherches sur les célébrités présentent souvent de nombreux risques. Nous avons découvert plusieurs sites
dangereux dans la catégorie des chanteurs célèbres (15,3 %) comme Usher et Nelly. Il en va de même dans la
catégorie des femmes célèbres (10,5 %) comme Lindsay Lohan et Paris Hilton. Les résultats dangereux sont
également très présents dans les expressions de recherche sportive (11,3 %) comme "Real Madrid" et "cricket". Il en
va de même dans les mots-clés préférés d'enfants (6,7 %) comme "Winnie the Pooh" et "Tweety".
En revanche, les mots-clés de la catégorie Web 2 de Google Zeitgeist comme "wikipedia" et "youtube" ne
contiennent pas de résultats dangereux. Parmi les autres catégories relativement sûres figurent le voyage d'été
(0,8 %) (exemples d'expressions : "Expedia" et "Travelocity") et les sorties week-end (0,4 %) (exemples
d'expressions : "USPS" et "Home Depot").
Analyse de mots-clés particuliers
Selon nos tests, le mot-clé particulier le plus dangereux (sur tous les moteurs de recherche) est bearshare (53,3 % de
résultats notés rouges ou jaunes). Bearshare est un programme gratuit de partage de fichiers qui installe des logiciels
publicitaires (selon nos tests). Il est également un mot-clé à risque car de nombreux sites facturent l'accès à ce
programme gratuit. Le pourcentage maximum de résultats rouges et jaunes est 90,9 % lors de la recherche de
"rotten.com" sur MSN.
Dix expressions de recherche les plus dangereuses :
Expression de recherche
1
2
3
4
5
6
7
8
9
10
bearshare
rotten.com
free screensavers
winmx
screensavers
limewire
kazaa
free ringtones
ringtones
lime wire
% de résultats
rouges/jaunes
53.3%
53.1%
53.0%
52.0%
48.2%
46.2%
45.8%
44.3%
43.8%
42.7%
Expressions de recherche pour adultes ou mineurs
Nos tests suggèrent que les expressions de recherche pour adultes sont deux fois plus susceptibles de mener à des
résultats peu sûrs. A des fins d'enquête, nous avons constitué un ensemble de 142 mots-clés de recherche pour
adultes. Pour ces mots-clés, 8 % des résultats sont notés rouges ou jaunes (4,1 % en cas d'expressions pour mineurs).
Les mots-clés pour adultes ont renvoyé un pourcentage supérieur de sites avec des risques liés aux navigateurs et de
mauvaises pratiques par e-mail.
Les expressions de recherche pour adultes sont deux fois plus susceptibles de mener à des résultats dangereux.
Discussion
Reste à voir si les classements des moteurs de recherche vont finalement évoluer pour tenir compte de la sécurité des
sites. Sur le moteur de Google, les classements des publicités incluent déjà une notion de "qualité de la page cible" et
les directives publicitaires mentionnent plusieurs facteurs jugés justes (par exemple, éviter l'envoi d'un nombre
excessif d'e-mails aux utilisateurs et d'obstacles liés à l'obtention d'un produit gratuit). Pourtant, nous restons alertés
par le fait que tant de publicitaires de Google continuent à promouvoir des services jugés frauduleux en promettant à
tort un élément "gratuit" ou en facturant un produit accessible ailleurs à tous gratuitement. Plus généralement, les
moteurs de recherche tirent profit des résultats sponsorisés des fraudeurs et donc les incite à conserver des sites aux
résultats peu sûrs. Des directives publicitaires strictes et un filtrage rigoureux peuvent réduire les revenus obtenus à
court terme par les moteurs de recherche mais leur profiter au final. Si les liens sponsorisés devenaient plus sûrs que
ceux non sponsorisés, les utilisateurs cliqueraient plus souvent sur les premiers et les publicitaires augmenteraient en
conséquence leurs dépenses de recherche payante.
L’anonymat qu’autorise le Web pose un problème que les moteurs peuvent tout à fait résoudre. En cas de passivité,
les fraudeurs peuvent manipuler le marché, tromper les consommateurs et apparemment s'en sortir sans problèmes.
Toutefois, les moteurs de recherche peuvent permettre d’éviter les sites dangereux en restreignant les publicitaires et
en interdisant les publicités trompeuses et malveillantes. Parallèlement, les utilisateurs engagés peuvent tirer parti de
ces avantages en installant le plug-in de navigateur McAfee SiteAdvisor, qui annote automatiquement les résultats de
recherche et indique son évaluation de sécurité.
Certains utilisateurs sont restés naïfs quant à la sécurité Web. Ils cliquent sur des options, envoient leurs adresses email et effectuent des téléchargements gratuits sans réaliser les conséquences, jusqu'à ce que les dommages se
concrétisent. En tant qu'acteurs de la sécurité Web, nous prenons cela à cœur, car leur expérience en ligne sera pire
au final que si l’environnement était plus sécurisé. D’autres cherchent à éviter les dangers du Web en limitant leurs
activités en ligne : ils se contentent de sites familiers, ne donnent jamais leurs adresses e-mail et ne téléchargent
jamais de nouveaux programmes. Le résultat est tout aussi désastreux : ces précautions les empêchent d'explorer le
Web et de profiter des nombreux sites utiles et divertissants. Nous devons pouvoir naviguer en toute sécurité, sans
préoccupation inutile. Nous espérons que les auteurs de moteurs de recherche prendront des mesures pour améliorer
la sécurité des résultats et ainsi simplifier l'activité des utilisateurs.
Autres graphiques et tableaux
Analysis of Organic Results by Search Engine et Analysis of Sponsored Results by Search Engine
Analysis by Zeitgeist Keyword Group (catégories de mots-clé les plus sûres et les plus risquées)
Analysis by Individual Keyword
Ressources
Forrester to Marketers: Let Age Define Your Buy - ClickZ
False and Deceptive Pay-Per-Click Ads - Ben Edelman
Google Revenue to Exceed $10 Billion in 2007 - eMarketer
How Consumers Find Web Sites In 2006 - Forrester
The Philanthropic Arm of Google - Google
Search Engine User Behavior Study - iProspect
Search Engine Market Share - Nielsen/NetRatings
Google AdWords Landing Page Quality Ranking Initiated - Search Engine Journal
Directives publicitaires des moteurs de recherche
Google – Consignes de rédaction Google AdWords
Consignes relatives aux pages de destination et à la qualité des sites de Google AdWords
Inside AdWords: Landing Page Quality Update
Yahoo! - Sponsored Search Listing Guidelines
MSN - AdCenter Search Ads Content Guidelines
AOL - Ad Specs - Policies and Guidelines
Ask - Sponsored Listings - Guidelines
Outil de sécurité Web SiteAdvisor
siteadvisor.com