cours recherche veille stagiaire

Transcription

cours recherche veille stagiaire
VEILLE STRATEGIQUE
OUTILS INTERNET
Martine Chaussade – Octobre 2007
SOMMAIRE
1
INTRODUCTION GENERALE........................................................................................................................................1
1.1
1.2
1.3
1.4
2
DIFFERENTES APPELLATIONS ...........................................................................................................................................1
TYPOLOGIES DE LA VEILLE ..............................................................................................................................................2
CLASSIFICATION DES INFORMATIONS ...............................................................................................................................2
VEILLE ET INTERNET .......................................................................................................................................................3
METHODOLOGIE DE VEILLE .......................................................................................................................................3
2.1
AUDIT DES BESOINS .........................................................................................................................................................3
2.2
COLLECTE DES DONNEES .................................................................................................................................................4
2.2.1
Sources formelles et informelles ...........................................................................................................................4
2.2.2
Typologies des sources...........................................................................................................................................4
2.2.3
Notes d’étonnement ...............................................................................................................................................6
2.2.4
Importance des réseaux personnels ......................................................................................................................6
2.2.5
Signaux faibles ......................................................................................................................................................6
2.3
TRAITEMENT DES DONNEES .............................................................................................................................................7
2.4
ANALYSE DES DONNEES ..................................................................................................................................................7
2.5
DIFFUSION DES RESULTATS..............................................................................................................................................7
3
PROTECTION DE L’INFORMATION ..........................................................................................................................8
3.1
3.2
4
DANGERS ........................................................................................................................................................................8
METHODOLOGIE DE PROTECTION ....................................................................................................................................8
RECHERCHE D’INFORMATIONS .................................................................................................................................9
4.1
ANNUAIRES .....................................................................................................................................................................9
4.1.1
Fonctionnement.....................................................................................................................................................9
4.1.2
Annuaires anglophones.......................................................................................................................................10
4.1.3
Annuaires francophones .....................................................................................................................................10
4.1.4
Fiche Open Directory ..........................................................................................................................................11
4.2
MOTEURS DE RECHERCHE .............................................................................................................................................12
4.2.1
Fonctionnement...................................................................................................................................................12
4.2.2
Stratégie de la recherche .....................................................................................................................................12
4.2.3
Moteurs de recherche anglophones ....................................................................................................................13
4.2.4
Moteurs de recherche francophones...................................................................................................................13
4.2.5
Fiche Yahoo France............................................................................................................................................14
4.2.6
Fiche Google........................................................................................................................................................15
4.2.7
Fiche Exalead ......................................................................................................................................................17
4.2.8
Fiche Ask.com .....................................................................................................................................................18
4.3
META-MOTEURS ............................................................................................................................................................19
4.3.1
Sites web (on line)................................................................................................................................................19
4.3.2
Logiciels (off line)................................................................................................................................................20
4.4
WEBLOGS ET FILS RSS ..................................................................................................................................................20
4.4.1
Weblogs................................................................................................................................................................20
4.4.2
Fils RSS ou flux RSS (RSS feeds).......................................................................................................................21
4.4.3
Agrégateurs/lecteurs RSS ....................................................................................................................................22
4.4.4
Outils de recherche des weblogs et des fils RSS .................................................................................................22
4.5
LISTES DE DIFFUSION, FORUMS (GROUPES DE DISCUSSION)............................................................................................23
4.6
LE WEB INVISIBLE .........................................................................................................................................................24
4.7
LES BREVETS .................................................................................................................................................................28
5
AGENTS « INTELLIGENTS »....................................................................................................................................29
5.1
5.2
5.3
5.4
5.5
6
TECHNOLOGIES « PULL » ET « PUSH »...........................................................................................................................29
AGENTS D’ALERTE ........................................................................................................................................................29
AGENTS TECHNOLOGIE PUSH AUTOMATISEE ..................................................................................................................30
ASPIRATEURS DE SITE....................................................................................................................................................31
SOLUTIONS DE VEILLE ...................................................................................................................................................32
AUTOMATISATION DE LA VEILLE ........................................................................................................................34
6.1
6.2
COLLECTE AUTOMATIQUE DES DONNEES .......................................................................................................................34
TRAITEMENT AUTOMATIQUE .........................................................................................................................................34
Martine Chaussade
6.3
7
ORGANISMES DE SERVICES DE VEILLE..............................................................................................................35
7.1
7.2
7.3
7.4
8
DIFFUSION SELECTIVE DES INFORMATIONS ....................................................................................................................34
INFOMEDIAIRES .............................................................................................................................................................35
EXPERTS........................................................................................................................................................................35
CLUBS DE VEILLE ..........................................................................................................................................................35
ASSOCIATIONS...............................................................................................................................................................35
LIENS UTILES ................................................................................................................................................................37
Martine Chaussade
Recherche et veille/outils internet
1 INTRODUCTION GENERALE
La maîtrise de l’information stratégique est aujourd’hui une nécessité absolue. Veiller c’est
surveiller pour anticiper, effectuer un transfert de connaissances, s’adapter… La veille peut
fournir des éléments essentiels nécessaires à la prise de décision : sortie d’un nouveau
produit concurrent, d’une nouvelle technologie, implantation géographique d’une entreprise de
produits complémentaires, image de l’entreprise…Elle révèle des menaces ou des opportunités
de développement « celui qui sait plus rapidement agit plus vite ». Elle est toujours orientée
vers le futur. Les informations recueillies permettront de prendre des décisions stratégiques
qui prendront effet dans plusieurs mois selon le métier ou l’activité de l’entreprise.
Cette démarche nécessite également une nouvelle forme de management, une structure
transversale et un partage des informations. Elle permet d'accompagner la gouvernance
d'entreprise.L’intelligence économique est restée de nombreuses années l’apanage de grands
groupes. Elle gagne peu à peu du terrain depuis la publication en juin 2003 du rapport réalisé
à la demande du Premier ministre par le député Bernard Carayon 1. Puis en janvier 2004 Alain
Juillet est nommé Haut responsable à l’intelligence économique auprès du Premier ministre.
Régulièrement des initiatives nationales, régionales sont annoncées.
Internet donne accès à un nombre d’informations en croissance exponentielle et l’entreprise
se doit de rechercher la pertinence. Avec une méthodologie associée à l’utilisation d’outils
(depuis les plus simples et gratuits aux plus sophistiqués et onéreux) chaque entreprise doit
pouvoir trouver une solution adéquate à ses besoins.
1.1
Différentes appellations
Veille stratégique, Intelligence économique, Intelligence stratégique
Quelques définitions :
« La veille stratégique est le processus informationnel volontariste par lequel l'entreprise
recherche des informations à caractère anticipatif concernant l'évolution de son
environnement socio-économique dans le but de se créer des opportunités et de réduire ses
risques liés à l'incertitude. Parmi ces informations figurent des signaux d'alerte précoce. »2
« L’intelligence économique peut être définie comme l’ensemble des actions de recherche, de
traitement et de diffusion (en vue de son exploitation) de l’information utile aux acteurs
économiques » 3.
« L’approche stratégique de l’intelligence économique répond au besoin de prendre une
décision . Elle répond à un besoin de savoir un minimum d’information nécessaire et d’agir pour
progresser vers une situation plus favorable. » 4
L’intelligence économique est un processus qui se construit et un moyen de gagner plus ou de
perdre moins (selon Yves Michel MARTI).
1
Rapport Carayon : « Intelligence économique, compétitivité et cohésion sociale »
www.guerreco.com
3
Commissariat du Plan
4
Rapport Cigref (Club informatique des grandes entreprises) mars 2003 « Intelligence économique et stratégique »
2
Martine Chaussade
1
Recherche et veille/outils internet
Le concept d’Intelligence économique recouvre une notion plus vaste que la veille stratégique,
c’est l’aboutissement d’un long processus de veille. Pour certains ces termes définissent des
notions quasi équivalentes. Ils décrivent une démarche active, collective pour collecter,
traiter et diffuser des informations fiables et pertinentes afin de faciliter les prises de
décision stratégiques.
1.2
Typologies de la veille
La veille se décline en plusieurs typologies : veille stratégique, veille économique, veille
environnementale, veille concurrentielle, veille technologique…
Quelques exemples :
Veille stratégique : c’est l’ensemble des activités de veille, approche globale
Veille technologique :
nouveau procédé de fabrication
nouveau produit ou service
nouvelle technologie
Veille économique :
développement ou récession d’u marché, d’une région
axes stratégiques de développement définis par l’Etat
aides financières, subventions
Veille environnementale :
réglementations, normes
sur tous les facteurs susceptibles d'influencer
directement ou indirectement l'activité de la société
Veille commerciale et concurrentielle :
marché des concurrents
implantation géographique
publication de rapports annuels
Nous aborderons la veille sous un aspect global. La veille technologique présente la
caractéristique d’être pratiquée depuis longtemps.
Pour certaines entreprises la veille sera globale, pour d’autres, certaines veilles sont
privilégiées selon les besoins à chaque entreprise.
1.3
Classification des informations
Information blanche
Publique et accessible, pas de sécurisation
particulière
Recherche avec les outils classiques.
Information grise
Se trouve de manière indirecte ou détournée,
information sensible d’accès légal
Utilisation des techniques avancées de
recherche, groupes de discussion,
listes de diffusion
Information noire
Information sous haute sécurisation, relève de
l’espionnage industriel.
Source : www.decisionnel.net/veille/veille.htm
Martine Chaussade
2
Recherche et veille/outils internet
1.4
Veille et Internet
Internet
un formidable outil pour la veille
Sources du monde accessibles en
permanence, en temps réel
Internet permet des échanges
auparavant impossibles ou difficilement
réalisables
Caractéristiques des
Informations sur Internet
Abondance
Difficilement
Rapidité
accessibles
Constamment
modifiées
Pas toujours fiables
accès
Bon marché
2 METHODOLOGIE DE VEILLE
La 1ère étape concerne la réflexion autour de la problématique de la veille et la mise en place
d’une méthodologie avant d’utiliser les outils adéquats. Etape essentielle, car il est nécessaire
ensuite d’adapter les ressources aux besoins.
Le projet devrait produire des résultats tangibles, si possible, rapidement. Une approche par
métier, par secteur d’activité sera plus limitée mais plus facile à mettre en œuvre. Après les
premiers résultats, l’approche transversale apportera une valeur complémentaire.
2.1
Audit des besoins
Il faut répondre à des questions essentielles :
Quel type de veille ?
Que chercher, que surveiller ?
Quelles sont les informations que
l'on n'arrive pas à connaître ?
Préciser la problématique
Etablir le lien impérativement avec la stratégie de
l’entreprise
Formuler toutes les hypothèses de recherche pour
répondre aux questions des opérationnels, pour surveiller
les concurrents, fournisseurs …
surveiller les domaines sensibles (nb en général compris
entre 3 et 7)
D’autres actions de recherche ponctuelles peuvent être
déclenchées pour répondre à un besoin précis.
recherche d’indicateurs
Quels sont les mots clés ?
domaines (technique, économique, social…), pertinence
permet de constituer des arborescences et un
thesaurus technique (recherche puis classement
information)
Quelles peuvent être les sources ? informations blanches, grises
Martine Chaussade
3
Recherche et veille/outils internet
vérifier les informations déjà détenues en interne
Quels sont les moyens de veille ?
presse spécialisée, contacts, salons, internet…
Quel budget peut-on y consacrer ? investissement humain mais aussi matériel et logiciel
sans oublier le coût de maintenance
Quel(s) niveau(x) de hiérarchie
doit accéder aux informations ?
employés, cadres, direction générale
Quelle structure adopter pour la
cellule de veille ?
par direction (commercial, communication…), ou
structure transversale pour une veille plus globale.
Etablir un plan de veille "pilote" qui pourra être décliné pour chaque sujet.
La phase de ciblage peut être facilitée par l’utilisation d’un système de type « mind mapping »
(ex. Mind Manager).
La définition de l’environnement de l’entreprise permet de cibler la recherche.
Questions avant toute recherche
1.
2.
3.
4.
2.2
Collecte des données
2.2.1
•
Où trouver l’information le plus
rapidement ?
Dans l’entreprise, en utilisant le
téléphone, internet …
Combien de temps accorder à la
recherche ?
Quels sont les mots clés pertinents ?
Quelle doit être la meilleure source sur
internet ?
Sources formelles et informelles
Sources formelles
Presse, livres, autres médias, banques de données et CD-ROM, brevets, sources
d’informations légales, études publiques réalisées par des prestataires
•
Sources informelles
Concurrents, fournisseurs, sous-traitants, missions, salons/expositions,
colloques/congrès/clubs, étudiants/stagiaires/thésards, candidats à l’embauche, comités
divers (organisations professionnelles...), sources internes à l’entreprise...
2.2.2 Typologies des sources
•
Organismes publics
Martine Chaussade
4
Recherche et veille/outils internet
•
ADIT (Agence pour la Diffusion de l’Information Technologique)
www.adit.fr/
ARIST (Agence Régionale pour l’Information Scientifique et Technique)
(n’existe plus à Bordeaux)
www.arist.fr/
INSEE (Institut National de la Statistique et des Etudes Economiques)
www.insee.fr/
Agence française pour le développement international des entreprises
(anciennement CFCE Centre Français du Commerce Extérieur)
www.ubifrance.fr/
Groupements professionnels
Centre de documentation des CCI
Chambre de commerce et d’industrie à l’étranger
•
Organisations et syndicats sectoriels
•
Consultants et experts
•
Bases de données
Pour sélectionner les bases de données adéquates, il existe un annuaire qui les
recense toutes : l’ADBS www.adbs.fr/
association des professionnels de
l’information et de la documentation.
L’accès aux différentes bases de données se fait par l’intermédiaire de serveurs tels
que :
QUESTEL et ORBIT tous deux gérés par France Télécom :
www.questel.orbit.com/fr/
DIALOG, DATASTAR, serveurs américains...
LEXIS-NEXIS www.lexisnexis.com
L’Européenne de données (filiale du groupe OR Télématique)
www.ort.fr/
Services proposés par Qwam
Quelques banques de données
ABES Agence bibliographique de l’Enseignement supérieur
www.abes.fr/
KOMPASS base de données entreprises
Martine Chaussade
www.kompass.fr/
5
Recherche et veille/outils internet
Registre du commerce
www.euridile.inpi.fr/
Recherche dans le Registre National du Commerce et des Sociétés, le Fichier du
Cadastre des Sociétés
Marques
INPI : www.icimarques.com/
Xerfi études de marché www.xerfi.fr/
•
Brevets (voir § dans Recherche d’informations)
•
Veille normative
•
Manifestations
Les salons et colloques sont des lieux à ne pas manquer pour ceux qui veulent suivre
l’évolution d’un secteur. Il est nécessaire de préparer et de cibler au maximum sa
recherche d’informations. Cela permet de collecter les informations les plus récentes,
de surveiller les concurrents,...
2.2.3 Notes d’étonnement
C’est un document utilisé par des personnes habituées à la collecte d’informations pour
rendre compte de renseignements intéressants après la visite de salons, la participation à un
colloque...
2.2.4 Importance des réseaux personnels
•
Créer son réseau à l’extérieur de l’entreprise, à l’intérieur
associations professionnelles, des anciens, extra-professionnelles (ex : Rotary, Lion’s
club...), laisser des cartes de visite
mobilité dans l’entreprise, stages de formation, rencontres autour d’un café...
•
Entretenir son réseau : garder le contact, échange d’informations
cartes de vœux, fêtes
veiller à la diversité et au nombre des relations.
2.2.5 Signaux faibles
Autre appellation utilisée : « signe d’alerte précoce »
« Nous appelons signe d’alerte précoce une information dont l’interprétation donne à anticiper
qu’un événement susceptible d’être important pour l’avenir d’une firme pourrait s’amorcer. » 5
5
« Signaux faibles et méthode cible » Rapport H.Lesca et J-C. Castagnos - Mai 2000
Martine Chaussade
6
Recherche et veille/outils internet
2.3
Traitement des données
Objectifs :
rejeter les informations peu intéressantes (bruit)
vérifier les informations
catégoriser les informations utiles
Parmi toutes les données recueillies, il faut extraire les informations les plus pertinentes, les
trier automatiquement. Le chargé de veille doit mettre en place des filtres, vérifier les
sources et croiser les informations.
Il est nécessaire d’effectuer une catégorisation des informations en fonction des
thématiques de veille définies précédemment. Les thèmes peuvent devenir des mots-clés
(tags ou méta-données) qui seront utilisés pour l’indexation des documents.
L’intervention humaine reste nécessaire et apporte sa valeur ajoutée. Une grille de notation
des informations par fonction traitée avec indication des sources peut aider au traitement et
à la sélection des sources.
2.4
Analyse des données
Cette étape permet de transformer les informations en connaissances.
Partie la plus ardue du processus. L'analyste doit connaître le domaine d'activité étudié, être
expert sur le sujet. Il doit avoir une vision structurée et transversale de l’entreprise ainsi
qu'un esprit d’analyse et de synthèse. Il est possible de faire appel à un expert extérieur à
l'entreprise.
Ses analyses pertinentes sont essentielles pour la réussite d’un processus de veille.
Les informations traitées doivent dégager des pistes de recherche suffisamment
pertinentes, des thèmes de réflexion, identifier des tendances.
Les documents élaborés (fond et mise en forme) permettent de visualiser les réponses aux
objectifs fixés lors de la 1ère étape : notes de synthèse, tableau de bord, étude,
cartographie..
2.5
Diffusion des résultats
La diffusion sélective (en fonction des sujets) dans l’entreprise constitue la dernière étape.
Le système d’information peut permettre un système d’abonnement sur profil.
Souvent cette diffusion sélective s’effectue via un Intranet sur un site portail d’accès
personnalisé.
Autres outils sous forme numérique : messagerie, groupware, interface web personnalisée
(EIP Enterprise Information Portail exemple MyLivelink), flux RSS (dernier type d’outil du
push qui permet la syndication de contenu – cf.§ 5.4.)
Outils classiques utilisés :
revue des presse
journal interne
Martine Chaussade
peuvent être diffusés sous forme numérique
7
Recherche et veille/outils internet
dossier d’information
réunion d’information orale
Ultime étape à ne pas négliger :
Vérifier l’utilisation de l’information diffusée (feed-back de la part de l’utilisateur)
permet d’améliorer la qualité des futures informations, de réorienter les recherches
peut entraîner des actions correctrices, des projets.
Cette veille doit se traduire en décisions opérationnelles (partie difficile et importante du
processus). Il faut savoir ensuite passer à l’action.
Exemple : programmation d’une réunion mensuelle pour travailler sur les informations
diffusées et prendre des décisions.
3 PROTECTION DE L’INFORMATION
3.1
Dangers
L’information est de plus en plus recherchée par tous, les risques et menaces augmentent, il
faut donc la protéger. Un des aspects de l'Intelligence Economique est l'amélioration de la
protection des informations.
2 types de dangers :
•
Accidentel : incendie, inondation, effacement des données par erreur...
•
Intentionnel : vol de données (par un employé ou une personne extérieure à l’entreprise),
sabotage, intrusion dans le système d’information via Internet, désinformation...
3.2
Méthodologie de protection
Avoir une politique de sécurité globale qui comprend la sensibilisation du personnel et les
procédures techniques de protection de l’information avec une vision à la fois proactive et
réactive. L'entreprise doit également suivre les risques en temps réel.
Etablir un ensemble de règles claires de classification et d'usage des informations (ex. : ne
pas photocopier…).
Faire une réflexion sur la stratégie de l’entreprise, toutes les informations ne sont pas
stratégiques. Attribuer à chaque information un critère de diffusion : diffusion globale ou
restrictive.
Repérer les circuits d’informations.
Etablir un plan de restauration du système d’information avant un problème quelconque.
Sensibiliser le personnel : informer des règles de protection de l’information.
Lister les méthodes que vos adversaires utiliseraient pour obtenir des informations sur votre
entreprise. Prendre les mesures nécessaires afin que ces méthodes soient inefficaces.
Martine Chaussade
8
Recherche et veille/outils internet
4 RECHERCHE D’INFORMATIONS
Le Web comprendrait environ 11,5 milliards de pages pour la partie «visible » c.a.d. indexable
en janvier 2005 selon une étude menée par deux chercheurs des universités de Pise (Italie)
et de l’Iowa (Etats-Unis). Aucune liste ne recense toutes les adresses de sites6. Selon cette
même étude 9,4 milliards seraient « trouvables » en utilisant les moteurs de recherche
majeurs. La croissance annuelle serait de plus de 15 millions de site (17,5 millions en 2005
selon l’éditeur britannique Netcraft spécialisé en analyses et statistiques réseau).
La recherche d’informations est ainsi extrêmement difficile à réaliser. Au-delà de
l’abondance d’informations, celles-ci sont parfois difficilement accessibles, modifiées sans
cesse et ne sont pas toujours fiables.
•
Typologie des outils de recherche
Deux grands types d’outils : les annuaires et moteurs. Mais ces dernières années les moteurs
ont pris une place prépondérante sur le marché de la recherche au détriment des annuaires
toujours utiles.
Autres types disponibles : Méta-moteurs, fils RSS, agents de veille
Le développement de « portails » permet de personnaliser l’accès aux sources d’information.
L’interrogation sur le web s’effectue au moyen de requête qui doit être la plus précise
possible afin d’obtenir des réponses pertinentes.
L’utilisation de tags (mots-clés du web 2.0) permet également d’effectuer des recherches.
Recommandations :
Tous les outils n’ont pas les mêmes critères de classement pour l’affichage des pages de
résultats, ils ne révèlent pas toujours l’information pertinente. Les meilleurs résultats sont
obtenus en combinant différents moyens.
4.1
Annuaires
4.1.1 Fonctionnement
Avec cet outil, les sites sont classés par thèmes et répertoriés par l’intervention humaine.
L’indexation se fait soit suite à une demande de référencement, soit après repérage par
l’équipe de l’annuaire.
L’annuaire peut être généraliste ou thématique.
L’internaute effectue la recherche par thème mais également à l'intérieur d'un corpus
(mot/expression).
Quant à l’annuaire, il recherche les sites sur leur description (faite par l’équipe de l’annuaire)
et/ou sur d’autres zones (titre, URL…), et non sur le contenu.
6
Les adresses de sites mentionnées dans ce guide peuvent ne plus exister le jour de votre consultation. Lorsque l’adresse est
composée de plusieurs pages, remonter dans l’arborescence, si nécessaire jusqu’à la racine.
Martine Chaussade
9
Recherche et veille/outils internet
4.1.2 Annuaires anglophones
Quelques outils :
www.lycos.com/
Looksmart
www.looksmart.com/
Open Directory
dmoz.org/
Yahoo!
www.yahoo.com
4.1.3 Annuaires francophones
Quelques outils :
Ari@ne
www.ariane6.com/moteurs.htm
Lycos France
www.lycos.fr/dir/
Nomade
www.nomade.fr/
Open Directory France
dmoz.org/World/Fran%c3%a7ais/
Yahoo France
fr.dir.search.yahoo.com/dir
Yahoo! France (portail)
www.yahoo.fr
Enfin
www.enfin.fr/
Annuaires spécifiques :
Martine Chaussade
Portail d’informations généralessur les
institutions, services publics français
www.adminet.fr/
Annuaire internet des sites
professionnels
www.indexa.fr/
Annuaire spécialisé : 700 sites
sélectionnés sur l’économie et le
management
www.ccip.fr/rime/
www.adminet.com/index_fr.html
10
Recherche et veille/outils internet
4.1.4 Fiche Open Directory
Services
Annuaire
dmoz.org/
dmoz.org/World/Fran%c3%a7ais/
Annuaire communautaire alimenté par des milliers de contributeurs, chacun étant responsable
d'une rubrique pour laquelle il indexe des adresses Web
Propriétaire AOL/Netscape
Champs de recherche
Environ 4,3 millions de sites en anglais (avril 2007), 209 000 sites pour la partie francophone
(juillet 2007) source Wikipedia
•
Entrer la requête
utiliser les opérateurs booléens, si nécessaire astérisque, parenthèses (cf. tableau page
suivante).
•
Limiter la recherche par la sélection de catégories ou de sites.
•
Par défaut les résultats comprendront tous les mots de la requêtes, activer si nécessaire.
Type recherche
Opérateur
Plusieurs mots
Action
Ajout automatique de l’opérateur AND entre les mots saisis.
Recherche d’une
expression
«»
Entrer l’expression entre les guillemets
Ne pas utiliser en recherche avancée sauf si un opérateur booléen doit être
considéré comme un mot clé
Recherche sur
plusieurs mots
+
-
Inclure obligatoirement le mot qui suit
exclure obligatoirement le mot qui suit
Avec mots clés
u:
Recherche d’un mot contenu dans l’adresse url (ex. u:veille)
Martine Chaussade
11
Recherche et veille/outils internet
spéciaux
4.2
d:
Recherche d’un mot contenu dans le descriptif du document (ex. d:veille))
t:
Recherche d’un mot contenu dans le titre du document (ex. t:veille)
c:
Recherche d'un mot dans l'intitulé d'une catégorie
Moteurs de recherche
4.2.1 Fonctionnement
Ils répertorient automatiquement les sites Web, indexent leurs adresses au sein d’une base
propriétaire ainsi que leur contenu et les liens hypertextes vers d’autres sites, à l'aide d'un
robot (crawler).
Le logiciel du moteur parcourt l’index pour identifier les mots correspondant à votre
question, trie les pages trouvées avant d’afficher le résultat.
Les pages graphiques (Flash) ou dynamiques (CGI, CFM, ASP,...), fichiers au format PDF etc.
ne sont pas souvent pris en compte sauf exception (cf. web invisible) par les moteurs de
recherche.
Règles générales pour la recherche :
Ne pas saisir les caractères accentués, la recherche s’effectue normalement sur ces
caractères accentués ou non.
Ne pas saisir de lettres en majuscule, la recherche doit s’effectuer à la fois sur les
minuscules et majuscules.
4.2.2 Stratégie de la recherche
Identifier les mots clefs nécessaires à la recherche (synonymes, concepts proche des mots
clefs).
Utiliser les recherches avancées avec opérateurs booléens, il est donc nécessaire de se
familiariser avec les moteurs sélectionnés et leur syntaxe.
Rechercher dans les adresses URL, dans le titre d’un document.
Utiliser les meilleurs moteurs, lancer les requêtes sur au moins 3 d’entre eux.
Sauvegarder les sites intéressants dans les signets
•
Recherche de mots clés :
Un bon mot-clé est suffisamment pertinent et peu fréquent pour que le moteur de recherche
l'ait indexé peu de fois.
De nouveaux outils proposent des classements de pages par dossier, par thème ou un
affichage graphique de liens sémantiques. Cela permet d’enrichir la liste de mots clés pour
une recherche.
Martine Chaussade
12
Recherche et veille/outils internet
4.2.3 Moteurs de recherche anglophones
Quelques outils :
Altavista
www.altavista.com
AlltheWEb (Fast)
www.alltheweb.com/
Askjeeves
www.ask.com/
Gigablast
www.gigablast.com/
Google
www.google.com/
4.2.4 Moteurs de recherche francophones
Quelques outils :
Martine Chaussade
Altavista France
www.altavista.fr/
AOL France
www.aol.fr/
Exalead
www.exalead.com/
Google France
www.google.fr/
Hotbot France
www.hotbot.fr/
Microsoft
www.live.com/
Voila
www.voila.fr/
Yahoo ! Search Technology
fr.search.yahoo.com/
13
Recherche et veille/outils internet
4.2.5 Fiche Yahoo France
Page recherche avancée
Services
Annuaire
fr.dir.search.yahoo.com/dir
Portail
www.yahoo.fr
Moteur
fr.search.yahoo.com/
Nombreux services disponibles : info, finance, loisirs, communication, achats
Champs de recherche
2 millions en anglais
Index mis à jour toutes les 4 à 6 semaines
•
Entrer la requête
utiliser si nécessaire l’astérisque, les guillemets (cf. tableau page suivante).
•
Sélectionner une ou plusieurs options.
•
Si souhaité limiter la recherche aux sources les plus récentes.
Type recherche
Opérateur
Plusieurs mots
Action
Ajout automatique de l’opérateur ET entre les mots saisis.
Recherche d’une
expression
«»
Entrer l’expression entre les guillemets
Recherche sur
plusieurs mots
+
-
Inclure obligatoirement le mot qui suit
exclure obligatoirement le mot qui suit
Martine Chaussade
14
Recherche et veille/outils internet
4.2.6 Fiche Google
Services
Moteur de recherche
www.google.com/
www.google.fr/
scholar.google.com/ site spécialisé sur la recherche de documents scientifiques et
universitaires
Champs de recherche
Plus de 8 milliards de documents
Rafraîchissement index : 4 semainesForums de discussion , news, fichiers image, vidéo et audio
(50 millions d'images, de séquences vidéo et de clips audio), produits divers
Sélectionne les pages en fonction du nombre de liens pointant vers elles et de la pertinence de
ces liens avec les mots clés.
Page recherche avancée
•
Entrer la requête dans les zones Pages contenant.
•
Autres options possibles :
choix de la langue
format de fichier
recherche sur date (3 derniers mois, 6 derniers ou année écoulée) emplacement dans la
pagerecherche de page sur le même domaine ou activité qu’un site
adresses url de sites à inclure ou exclure
recherche de pages similaires ou ayant des liens avec un site
Martine Chaussade
15
Recherche et veille/outils internet
Type recherche
Opérateur
Plusieurs mots
Recherche d’une expression
Action
Ajout automatique de l’opérateur ET entre les mots saisis.
«»
Entrer l’expression entre les guillemets
Certains caractères dont les traits d'union, les obliques, les points, les
signes d'égalité et les apostrophes fonctionnent comme des guillemets
Mots stop
Ignore les caractères et mots courants, certains chiffres et certaines
lettres uniques, ils sont nommés "mots stop" (ex. cellule de veille pour
recherche sur cellule et veille)
Utilisez le signe "+" pour inclure des mots stop dans la recherche , à
faire précéder d'un espace (ex. « OS/+2 pour recherche OS/2)
Recherche simple
+
-
Bouton
J'ai de la chance
Avec mots clés spéciaux
Inclure
exclure
Charge automatiquement la 1ère page web retournée par la requête
inurl:
allinurl:
Recherche d’un mot contenu dans l’adresse url (ex. inurl:veille)
Recherche de plusieurs mots contenus dans l’adresse url
(ex. allinurl:veille urfist)
intitle:
allintitle:
Recherche de mots contenus dans le titre puis dans la page (ex.
intitle:veille outils recherche veille dans le titre puis outils dans la
page)
Recherche de plusieurs mots contenus dans le titre (ex. inurl:veille
outils recherche veille et outils dans le titre)
site
Indique le nb de pages indexées pour un site. Ex : site :www.ibm.com
link:
Recherche les pages ayant un lien vers l’URL précisée (ex.
link:www.abondance.fr)
info:
Recherche d’informations à propos de l’URL précisée (ex. info:
www.abondance.fr)
related:
Recherche de pages similaires à l’URL précisée (ex. related:
www.abondance.fr)
cache:
Recherche de la version archivée (cache) de l’URL précisée
(ex. cache: www.abondance.fr)
Martine Chaussade
filetype:
Recherche sur le type de fichier (ex. : filetype:pdf)
define:
Recherche sur les mots (ex. : define:veille permet de trouver des
définitions du mot veille)
16
Recherche et veille/outils internet
4.2.7 Fiche Exalead
Services
Moteur de recherche
www.exalead.fr/search
Champs de recherche
8 milliards de pages (octobre 2006)
Index mis à jour toutes les 4 semaines
Forums de discussion , news, fichiers image, vidéo et audio (50 millions d'images, de séquences
vidéo et de clips audio), produits divers.
Page Recherche avancée
•
Dans la partie Find pages, les listes déroulantes autorisent un grand choix de la place des
mots dans les pages, titre ou url d'un site.
•
Les zones suivantes permettent d'affiner les recherches.
Type recherche
Opérateur
Action
Recherche d’une
expression
«»
Entrer l’expression entre les guillemets
Opérateurs booléens
ET ou +
Recherche de documents comportant tous les mots
- (sauf)
Rejette les documents comportant l’expression suivant l’opérateur
site:
Recherche d’un mot contenu dans les pages d'un site (ex. +recherche
+site:abondance.fr)
title:
Recherche d’un mot contenu dans le titre du document (ex. title:veille)
language:
Recherche sur une langue (ex. : veille language:fr)
Recherche avancée
mots clés spéciaux
Martine Chaussade
17
Recherche et veille/outils internet
4.2.8 Fiche Ask.com
Services
Moteur de recherche
www.ask.com/
fr.ask.com/
version française bêta (depuis déc 2005)
Champs de recherche
5,3 milliards de pages
Index mis à jour toutes les 4 semaines
Forums de discussion , news, fichiers image, produits divers
Nouveau moteur d'images (janvier 2006)
Nouvelles fonctionnalités dans les pages de recherche du site américain (décembre 2005)
Page Recherche avancée
•
Entrer la requête dans les 4 premières zones suivant les opérateurs choisis.
•
Autres options possibles :
emplacement : page, titre ou url
choix de la langue
domaine
région du monde
recherche sur date
Type recherche
Opérateur
Action
Plusieurs mots
ET ou +
Ajout automatique de l’opérateur ET entre les mots saisis.
OR
Recherche de documents comportant au moins l’un des mots
Exclusion SAUF
-
Rejette les documents comportant l’expression suivant l’opérateur
Recherche d’une expression
«»
Entrer l’expression entre les guillemets
Certains caractères dont les traits d'union, les obliques, les points, les
signes d'égalité et les apostrophes fonctionnent comme des guillemets
Martine Chaussade
18
Recherche et veille/outils internet
Avec mots clés spéciaux
4.3
inurl:
Recherche d’un mot contenu dans l’adresse url (ex. inurl:veille)
intitle:
Recherche de mots contenus dans le titre (ex. intitle:veille recherche veille dans le titre)
Méta-moteurs
Utilisent plusieurs moteurs simultanément. Ils ne maintiennent pas d'index de sites mais
lancent une requête d'information simultanée sur plusieurs moteurs de recherche du Web et
centralisent les résultats. Sous la forme d'une interface Web ou en tant que logiciels
clients.
•
Fonctionnalités suivant les logiciels :
simple automatisation de la consultation parallèle de plusieurs moteurs
choix des moteurs à lancer en fonction de la nature de l'information demandée
traitement des informations récoltées.
Sont des outils capables de lancer plusieurs moteurs de recherche sur le Web en
fonction de la nature de l'information demandée et de synthétiser les résultats plus
ou moins intelligemment : dédoublonnent et trient les premiers résultats des
moteurs.
Peuvent comprendre des fonctions de veille, avec la possibilité de programmer la
recherche automatique d'une information (surveillance du contenu d'un site et alerte
automatique lorsque celui-ci est modifié).
Ils permettent souvent la navigation off-line et offrent des options de gestion de
l'information recueillie, plus ou mois avancées.
4.3.1 Sites web (on line)
Quelques outils :
Produit
Site web
Commentaires
Dogpile (USA)
WebFetch (Europe)
www.dogpile.com/
www.webfetch.com/
Recherche dans 10 moteurs de recherche, avec la possibilité de
rechercher par thème (,mp3,images,web…)
Iboogie
www.iboogie.com/
Outil avec une interface simple et dépouillée. Classement de résultats
dans des dossiers thématiques
Ixquick
www.ixquick.com
Recherche dans 11 moteurs de recherche, avec la possibilité de
rechercher par thème ( infos, images,web ) de plus celui-ci élimine les
doublons
Kartoo
www.kartoo.com/
Présente les résultats sous forme de carte.
Meta-crawler
www.metacrawler.com ou
www.go2net.com/
pas de base de données locale
- interroge plusieurs moteurs : Lycos, Infoseek, WebCrawler, Excite,
AltaVista, Thunderstone, The Mining Co., Looksmart, and Yahoo.
- organise les résultats en un format unique , les range par pertinence
Open Text
www.queryserver.com/web.ht
m
Recherche dans 10 moteurs, classe les réponses par catégorie
Martine Chaussade
19
Recherche et veille/outils internet
Polymeta
polymeta.com/
Synthétise ses résultats dans un système de clustering et affiche des
images directement dans la page du résultat.
Search.com
www.search.com/
Point d'accès à plus de 800 moteurs de recherche, guides, magasins,
archives de Usenet et de news, bibliothèques de logiciels
- Mot-clé envoyé simultanément aux moteurs de recherche
- Résultats rassemblés et organisés selon la pertinence
Surfwax
www.surfwax.com
Propose quatre types d’offres payantes. L’offre PERSONAL permet,
grâce à une formule gratuite, de découvrir la plupart des
fonctionnalités.
Vivisimo
www.vivisimo.com/
Interroge plusieurs moteurs et classe ensuite les résultats dans des
dossiers différents par thèmes
Webcrawler
www.webcrawler.com
Recherche par catégorie, également fonction recherche sites de news
Webbrain
www.webbrain.com
Affichage des résultats sous forme de cartographie, permet de faire
des associations de concepts
4.3.2 Logiciels (off line)
•
Principes et avantages :
Ces outils peuvent être classés dans la catégorie "d’agents intelligents".
Ont des fonctions avancées, surtout par leurs modes de traitement et de restitution, plus ou
moins sophistiquées.
Une partie cliente, l’interface d'interrogation et de consultation est installée sur le disque
dur.
Certains outils seront étudiés dans la partie Agents intelligents.
Produit
Site web
Prix ht
Commentaires
Copernic
www.copernic.com
Webferret
www.webferret.com/
Gratuit 2 versions. Choix des moteurs interrogés, du
nombre de résultats par page, possibilité de
29,95$
filtrer les réponses.
Webseeker
www.bluesquirrel.com/
products/webseeker
29,95$ Utilise plus de 100 moteurs ou annuaires, élimine
les doublons et liens caduques, ajout de moteurs
possible, opérateurs booléens, mise à jour
automatique des liens. (démonstration en
téléchargement)
4.4
Basic : gratuite De la version gratuite permettant de faire de la
Personal : 29,95€ recherche à la version professionnelle
Professional : permettant de faire de la veille.
79,95€
Weblogs et fils RSS
4.4.1 Weblogs
Blog, Blogue (contraction de « web » et de « log »), carnet de bord
Suite d'articles datés diffusés sur le web, avec une mise à jour fréquente. Le weblog est un
outil simple qui permet d'écrire sans se soucier de la technique (HTML, FTP...): un simple
navigateur internet et un accès à Internet suffit. Le terme anglais weblog signifie
Martine Chaussade
20
Recherche et veille/outils internet
littéralement journal de bord sur le web, le terme québecois est webillard (dérivé de
babillard, la traduction de BBS).
Les articles sont datés (classement sur la date par ordre décroissant) et signés, les lecteurs
peuvent y ajouter des commentaires. Les weblogs peuvent être écrits par des experts,
consultants, membres d’entreprise (voir page suivante).
Les répertoires et les moteurs sont les 2 outils les plus simples pour trouver des blogs. Ces
weblogs comprennent beaucoup de liens et permettent de découvrir d'autres ressources
d'intérêt, qu’il s’agisse de weblogs ou non..
Exemples de weblogs :
Weblog
Commentaires
www.urfist.info/
Créé et animé par le réseau des URFIST (Unité Régionale de Formation
à l'Information Scientifique et Technique), il traite de l'actualité des
sciences de l'information et du monde de la documentation et des
bibliothèques
joueb.com/outilsfroids/infos.sh
tml
A pour but d'informer les "knowledge workers" des nouveaux outils,
usages, methodologies, concepts, pouvant les aider à améliorer leur
productivité personnelle au quotidien.
www.verbalkint.net/
Intelligence économique et internet
www.itligentia.com/
Veille et recherche d’informations
4.4.2 Fils RSS ou flux RSS (RSS feeds)
RSS (Real Simple Syndication ou syndication vraiment simple)
Ils permettent de surveiller un weblog et sont générés automatiquement. Le format de
données XML utilisé comprend les principales informations (titre, description, auteur, date)
sur les modifications récentes des messages publiés sur un blog.
Comme les blogs, les fils RSS figurent souvent sur les sites web qui proposent des actualités.
Compte tenu de sa simplicité, c'est actuellement le format web qui se développe le plus vite
pour l'export et l'exploitation d'actualités. Les flux RSS sont utiles à tous les sites
fréquemment mis à jour. Ils ne sont pas réservés à des articles ou des messages et peuvent
contenir aussi un lien pointant vers une nouvelle entrée dans un catalogue, etc.
Le podcasting permet de lire en ligne des fichiers audio à partir de fils RSS.
•
Créer un flux RSS
Les outils de gestion de contenu ou de weblog incluent souvent une fonctionnalité permettant
de produire les flux RSS correspondant aux dernières informations entrées sur le site.
•
Lire un flux RSS
Il faut un logiciel qui convertisse le XML en HTML : un "agrégateur de news" ou "lecteur
RSS". Ces lecteurs RSS proposent des listes de flux RSS auxquels il est possible de
Martine Chaussade
21
Recherche et veille/outils internet
s'abonner et des moyens de classement de ces flux. Le logiciel peut avoir sa propre interface
ou s’intégrer à un client de messagerie comme Outlook.
4.4.3 Agrégateurs/lecteurs RSS
Le choix du lecteur/agrégateur se fera suivant l’utilisation et la configuration mises en
œuvre :
•
outil de veille a posteriori permettant de stocker les informations dans le client de
messagerie pour analyse ultérieure
•
outil de veille en temps réel pour suivre les informations au fur et à mesure de leur
parution. Le lecteur/agrégateur peut être intégré ou non au navigateur web.
•
outil collaboratif pour un partage d’informations : envoi de flux RSS par mél ou écriture
d’un article sur un blog. L’outil doit alors comprendre les fonctions d’envoi et de
publication.
Quelques lecteurs :
Lecteurs Web
Bloglines
Service en ligne permettant de chercher, créer et partager des flux RSS ou de s'y
abonner
Google
Avoir un compte gmail. Interface utilisateur avec onglets
Netvibes
En version beta, accessible gratuitement, import des fils RSS, interface usager
facilement personnalisable, comportant d'autres services
Agrégateurs pour Windows, à installer
Feedreader
Peut se lancer automatiquement au démarrage et permet ou non l'affichage automatique
des nouvelles
RssReader
Payant. Lit également les podcasts
Windows Live
avoir un compte courrier MSN ou hotmail
Agrégateurs Intégrés dans un navigateur ou dans un gestionnaire de courrier
Mozilla Thunderbird
création d'un compte spécifique pour les fils RSS et l'archivage des fils d'information.
Linux, Windows, Apple
NewsGator
Peut s’intégrer à Outlook
Opera
Linux, Windows, Apple
Agrégateur multiplateforme, à installer
Ippoder
Permet de choisir et écouter les podcast
Liste extraite de la source urfist : http://www.ext.upmc.fr/urfist/rss/agregateur.html
4.4.4 Outils de recherche des weblogs et des fils RSS
Quelques moteurs de recherche et annuaires de fils RSS et blogs
Moteur
www.blogdimension.com/
Martine Chaussade
moteur de recherche de blogs francophones
22
Recherche et veille/outils internet
www.technorati.com/search
3 modes de recherche principaux : mot-clé, url et tag
feedster.com/
moteur de recherche très puissant de fils RSS
www.Yahoo.fr
localise des sites Web et leur fil XML lorsqu'il existe ou est repérable. En
outre, depuis octobre 2005 moteur de recherche de blogs en version bêta
qui permet d'afficher, en plus des pages web, les résultats pertinents issus
de blogs
www.google.fr/blogsearch
référence les blogs du monde entier, options de recherche avancée
www.exalead.fr/search
Permet de trier les résultats en fonction de l'existence de fils RSS
Annuaires
www.retronimo.com/
annuaire de flux RSS francophones et également lecteur de nouvelles
www.lamooche.com/annuaire_rss.php
annuaire de fils RSS et lecteur de nouvelles (grands médias, uniquement)
w.moreover.com/categories/category_list_rss.h
t
annuaire thématique de fils RSS par catégories d'infos agrégé par la société
MoreOver (une référence sur la veille informative)
www.rssfeeds.com/
recherche par catégorie.
www.2rss.com/
annuaire où il est possible d'ajouter ses propres sources
4.5
Listes de diffusion, forums (groupes de discussion)
S’abonner à des lettres électroniques, rechercher ou participer à des forums. La veille est
thématique. C’est un moyen simple, souvent gratuit, de se tenir au courant des
développements dans un domaine mais également de mesurer les échanges sur un sujet.
•
Principes de fonctionnement :
On s’abonne aux listes de diffusion (newsletter) et l’on reçoit les informations par e-mail
périodiquement. Elles se situent sur des sites d’actualité et les courriers sont souvent
rédigés par des experts du thème concerné.
Les forums et les groupes de discussion permettent de pouvoir communiquer sur des sujets
extrêmement variés.
Chacun peut intervenir dans un forum de discussion par un message ou une réponse à un
message.
Usenet est un réseau d'ordinateurs qui s'échangent des informations (News) sur l'ensemble
des newsgroups.
Autre possibilité : lire les FAQ (questions les plus fréquemment posées).
•
Thèmes des forums de discussion
L’organisation des forums (ou newsgroups) se fait par thème et le nom du groupe est
généralement de type :
Cat.dom.thème
Catégorie
générale
Martine Chaussade
Domaine
dans la
catégorie
Thème
d’intérêt
plus pointu
23
Recherche et veille/outils internet
•
biz.
Business
comp.
Informatique
fr.
Groupes francophones
Le code ISO du pays détermine
l’appartenance géographique du
groupe.
Recherche
Elle peut se faire par des moteurs de recherche classiques. Il faut alors sélectionner l’option
du moteur permettant de rechercher sur les forums (usenet ou news…).
Ou avec des outils spécifiques :
Annuaires des forums et listes de diffusion francophones
www.francopholistes.com/
Annuaires internationaux de forums et de mailing lists
lists.topica.com/dir/?cid=0
directory.dolist.net/annuaire_fr.asp
Recherche de newsletters dans des n° déjà publiés de
plusieurs milliers de newsletters.
newsletterarchive.org
Annuaire lettres d’information (décisionnel)
www.pidinfo.com/
Moteur
groups.google.com/
fr.groups.yahoo.com/
News
4.6
www.mailgate.org/
Le Web invisible
La majeure partie du web est mal ou pas indexé par les moteurs car :
•
tous les formats des documents ne sont pas reconnus par les moteurs (les moteurs
majeurs comme Google ou Fast reconnaissent toutefois de plus en plus de formats...).
Formats référencés : HTML, PDF. Les documents multimédias (audio-vidéo, images), en
constante augmentation, sont plus difficiles à indexer que les pages de texte.
•
de nombreux sites importants utilisent des pages «dynamiques» et non «statiques»
(HTML simple), pages générées lors d'une requête par exemple
•
certains documents sont trop volumineux pour être entièrement indexés
•
des pages peuvent être protégées par l'auteur (mots de passe, balises meta qui stoppe le
robot),
•
des pages sont invisibles car aucun lien ne pointe vers elles
Martine Chaussade
24
Recherche et veille/outils internet
Le "Web invisible" ("Deep Web") représente donc les informations contenues dans les
fichiers et bases de données non indexables et les sites non référencés, inaccessibles aux
moteurs "classiques". Exemples de sites les plus volumineux : portails scientifiques , bases de
données ) sites universitaires ) sites de médias et presse en ligne ) de commerce en ligne )
sites internes de grosses sociétés )sites d'annonces, de bibliothèques en ligne...
Martine Chaussade
25
Recherche et veille/outils internet
L’accès au web invisible peut se présenter ainsi :
OUTILS
Recherche
par
requête
COMMENTAIRES
Outils spécialisés, moteurs :
www.incywincy.com/
turbo10.com/
2loq.com/ www.xrefer.com moteur britannique spécialisé (logiciel)
www.thebighub.com/ Outils spécialisés, répertoires :
www.completeplanet.comwww.intute.ac.uk/www.beaucoup.com/
www.findarticles.com/ www.fossick.com/Europe.htm
Recherche
thématiqu
e
Portails, serveurs organisés par thème référençant les gros sites et bases de données.
Utiliser le moteur de recherche interne à chaque base pour une recherche sur le contenu.
Quelques exemples :
Portail ou base
Adresse site
Liste bases de données gratuites (J.P.Lardy,
université Lyon, urfist)
dadi.enssib.fr/
Liste principaux serveurs de bases de
données commerciaux (J.P.Lardy, université
Lyon, urfist)
urfist.univ-lyon1.fr/bd-serv.html
Nlsearch (Northern Light) : plusieurs
millions d’articles et d’études à forte valeur
ajoutée, classement résultats par thème
(payant)
www.nlsearch.com
Dialog coporation
www.dialog.com/
Dialogweb
www.dialogweb.com/
Dun & Bradstreet
www.dnb.com/us/
Pas de degré de
pertinence des
différentes bases.
Mais elles peuvent
être riches en
information
stratégique (accès
payant en général),
notamment pour
celles des services
bibliographiques et
des brevets. Ces
derniers font l’objet
d’une validation par
un dépôt légal et ou
publication, puis d’un
recensement.
dbfrance.dnb.com/French/defau
lt.htm
Questel Orbit
www.questel.orbit.com/fr/
Qwam
www.qwam.com/
Lexis Nexis
www.lexisnexis.com/
Association des professionnels de la
documentation (accès à un répertoire de
liens)
www.adbs.fr/
The Electric Library : articles journaux,
magazines, livres, emissions radio TV,
photos et images (payant)
www.elibrary.com/
Sites institutionnels
International : utiliser
+domain:gov
France : .sites se terminant par gouv.fr
exemple :
Ministère des finances
www.finances.gouv.fr
Martine Chaussade
26
Recherche et veille/outils internet
Ministère de la culture (bases de données)
www.culture.gouv.fr/culture/bdd
/index.html
Signets de la Bibliothèque nationale de
France (environ 1700 ressources)
signets.bnf.fr/
Inist
portail information scientifique et
technique, sujets de thèses grandes écoles
www.inist.fr/
Inria
www.inria.fr/publications/index.
fr.html
Infothèque francophone : ressources en
ligne et actulaités scientifiques
francophones
www.infotheque.info/
Sélection 1000 meilleurs portails d'affaires
sectoriels
www.objectifgrandesecoles.com/
pro/secteurs/index.htm
Portail exportation
www.telexport.tm.fr/
Martine Chaussade
27
Recherche et veille/outils internet
4.7
Les brevets
Nom site
Adresse
INPI recherche gratuite des 2 dernières années de brevets
www.plutarque.com/
Office européen des brevets
www.european-patent-office.org/index.htm
Base Patents US (20 ans de brevets américains)
www.uspto.gov/patft
Site d’IBM créé en mai 2000
www.delphion.com/
Organisation Mondiale de la Propriété Intellectuelle (présente
la classification internationale des brevets CIB)
www.wipo.int/classifications/fr/
IPR-Helpdesk – Propriété intellectuelle en Europe
www.ipr-helpdesk.org/index.htm
CNCPI (Compagnie nationale des conseils en propriété
industrielle)
www.cncpi.fr/
Les contenus des textes de demandes de brevets sont publiés, au 18ème mois de leur dépôt.
Ils représentent environ 8O% de la connaissance technologique disponible et accessible :
c’est donc une source d’informations très utile pour ceux qui sont capables d'en faire les
analyses.
Martine Chaussade
28
Recherche et veille/outils internet
5 AGENTS « INTELLIGENTS »
Au delà de la recherche d’informations, ces outils permettent une automatisation de cette
recherche et doivent être capables de réagir sur la base d’observations effectuées, par
exemple lorsque de nouvelles informations sont publiées.
Leurs principales caractéristiques sont :
Une économie de temps à la fois pour le veilleur (grande quantité d’informations à traiter) et
pour la visite des sites
•
Un balayage pertinent et le plus exhaustif possible des sources
•
Une détermination de manière automatique des signaux faibles.
•
Ces logiciels analysent le contenu des sites, trient les informations et les enregistrent sur
le disque dur. Souvent une partie cliente doit être installée sur le disque pour que l’agent
effectue la veille.
5.1
Technologies « Pull » et « Push »
La technologie la plus couramment utilisée sur le Web est appelée « Pull », car l’utilisateur
doit aller chercher les informations. La technologie « Push » consiste à délivrer de manière
automatique des informations disponibles, en fonction des critères de sélection retenus par
l’utilisateur.
5.2
Agents d’alerte
•
Principes et avantages :
Ils signalent les modifications intervenues sur une ou plusieurs Url(s) précédemment
identifiée(s) par envoi d’un courrier électronique (agent Pull).
Ces agents effectuent automatiquement la collecte de données.
Certains outils sont faciles à utiliser mais leurs activités de veille restent limitées.
•
Quelques agents
Editeur
Produit
Site web
Prix
ChangeDetect
ChangeDetect
www.changedetect.com/
Copernic
Copernic Tracker
www.copernic.com/fr/
49,95€ Surveille de changements de mots,
images… alerte par courriel, sur le
bureau ou sur téléphone portable.
Autres fonctonnalités disponibles.
30j essai gratuit
Digimind
Digimind Monitor
www.digimind.fr/monito
r.htm
Payant Intègre la surveillance de sites web
complets grâce à un crawler capable de
tracer l'arborescence d'un site avant de
le placer en veille.
Google
Martine Chaussade
www.google.com/alerts?
gratuit
Commentaires
Surveille et alerte de changements dans
un site web.
Gratuit alerte par courriel dès qu'un mot clé
29
Recherche et veille/outils internet
choisi est présent dans une dépêche
d'actualité du site Google News, ou
lorsqu'un nouveau lien apparaît dans la
liste des résultats du moteur de
recherche. Mots-clés en anglais,
français, italien, allemand, espagnol et
chinois (max. 50 alertes)
hl=fr
Peacefire
TracerLock
www.tracerlock.com/
Website
Watcher
Website Watcher
aignes.com/
Sénat
5.3
4$/mois Standard
19,5$/m Premium
Surveillance et d'alerte de changements
de contenu en fonction de mots-clés,
alerte par e-mail. Surveillance possible
de groupes Usenet
Nouveau service de surveillance sur les
centaines de sources d'actualité en ligne
(alerte possible toutes les 15 mn)
gratuit 30jours
Fusion avec The Informant (rachat)
29,95€
49,95€
99,00€
1990,00€
Basic Edition
Personal Edition
Business Edition
Business Edition – site Licence
surveille et alerte des changements de
contenu. Le suivi de chaque site peut
être personnalisé. Nombreuses autres
fonctionnalités.
gratuit Nouveau service de veille parlementaire
par courriel (6/3/2006)
www.senat.fr
Agents technologie push automatisée
Ils assurent la collecte et le prétraitement des données.
Envoi automatique d'informations (page Web ou E-mail) selon des critères sélectionnées par
l'utilisateur. : il définit son profil.
•
Quelques agents
Nom
Connection
Prix
Commentaires
fr.my.yahoo.com/
on line
gratuit L’utilisateur choisit les rubriques qui
l’intéressent et peut ensuite les
consulter (actualité, météo, prix des
actions, résultats sportifs et
ressources web)
www.net2one.fr
e-mail
Gratuit Net2one Référence des milliers de
et Plusieurs sources d'informations. Permet de
forfaits déterminer un profil et de surveiller
ainsi les sujets de son choix (payant
suivant le nombre de mots clés).
www.newspage.com/
e-mail
Gratuit Inscription gratuite à une page web
d’information dans laquelle on choisit
son profil (my newspage).
www.watznew.com/
e-mail
24,95€ Permet de construire un portail
d'information personnalisé sur
Internet
Martine Chaussade
30
Recherche et veille/outils internet
On-line
www.wikio.fr
5.4
gratuit Moteur de recherche d’actualités
(médias et blogs). L’utilisateur crée un
profil de pages à surveiller par la saisie
de mots-clés (un profil par onglet).
S’inscrire sur le site afin de
sauvegarder cette page personnalisée,
elle est alors accessible depuis
n’importe quel poste connecté à
Internet
Aspirateurs de site
•
Principes et avantages :
Logiciels qui se connectent automatiquement sur un site et en "aspirent" les pages. Ils
effectuent une recopie du site sélectionné sur le disque dur et permettent une lecture "offline" par la suite.
Un des avantages est de pouvoir programmer la récupération de tout ou partie de sites à des
heures de moindre trafic et de consulter certaines pages en détail sans être vu de
l’extérieur.
De nombreuses possibilités de paramétrage existent : profondeur des liens à explorer,
limitations en taille/nombre de fichiers, définition du type de documents à rapatrier ou à
exclure.
•
Principaux logiciels disponibles
Editeur
Produit
Site web
Blue Squirrel
WebWhacker 2000
www.bluesquirrel.com
/
Goto Software
MemoWeb 4
www.goto.fr
Prix
Commentaires
49,95$ Version évaluation gratuite
25,00 €
Découverte
MemoWeb 4
Wysigot
Wysigot (Ecatch)
www.wysigot.com/
Gratuit
31,77 € Fonctions avancées
www.ecatch.com
Maxim Klimov
WebCopier
www.maximumsoft.co
m
30$
MetaProducts
Offline Explorer
Offline Explorer Pro
www.metaproducts.co
m
30$ Version évaluation gratuite
70$
SoftByte Labs
BlackWidow
www.softbytelabs.co
m
39,95$ Version évaluation gratuite
Spidersoft
WebZIP standard
WebZIP unlimited
www.spidersoft.com
39,95$ Version évaluation gratuite.
59,95$
SurfWare
Aaron’sWebVacuum
surfware.bizland.com
29,95$ Téléchargement de fichiers à
partir de sites.
Version évaluation gratuite
Martine Chaussade
31
Recherche et veille/outils internet
Tennyson
Maxwell
5.5
Teleport Pro
39,95$ Version évaluation gratuite
www.tenmax.com
Solutions de veille
Quelques solutions
Editeur
Aignes
Produit
WebSite-Watcher
Site web
www.aignes.com/features.htm
Commentaires
Contrôle si des mises à jour ont été faites sur plus
de 100 sites par minute et télécharge les
modifications sur le disque dur. Mise en évidence
des changements automatiques. Alertes par courriel
ou ouvre le site concerné si mise à jour détectée.
De 29,95 € à 1 990 €
Arisem
Kaliwatch Pro
Kaliwatch Server
www.arisem.com/fr/produits/i Surveillance du Web en continu, classification de
ndex.html
l'information selon des catégories prédéfinies et
sous forme d'arborescence, diffusion de
l'information en mode alerte. Kaliwatch Server
propose, en outre, de multiples fonctionnalités de
travail coopératif.
BEA Conseil
KB Crawl
www.beaconseil.com/site/main Surveillance de toutes les sources identifiées.
.php3?id_rubrique=199&fkpar Alertes sélectives par courriel lors de changement
ent=6
de contenu, apparition de mots-clés ou de nouvelle
page. Difusion de rapports de veille. Archivage des
documents trouvés.
Copernic
Copernic Agent
Professional
www.copernic.com/
Copernic Tracker
Copernic Summerize
Accès à plus de 1 000 moteurs de recherche
répartis en 120 catégories. Surveillance des
contenus d'un nombre illimité de pages Web.
Résumés des pages Web trouvées et extraction de
leurs concepts clés. Alertes par courriel avec copie
de la page où les changements sont surlignés.
Prix suite 3 produits : 119,95 €
Intelliseek
Marketing
intelligence
intelliseek.com/solutionsbybiz
.asp
Propose une gamme de solutions répondant à des
besoins marketing. Une autre gamme de produits
s'adresse à des besoins industriels.
Sinequa
Intuition Corporate
Edition
www.sinequa.com/html-fr/frproduit.ice.html
Le moteur de recherche Intuition l'ensemble des
sources d'information internes et externes à
l'entreprise et orffre une interface personnalisée
de recherce et de navigation.
www.autonomy.com/content/P
roducts/IDOL_K2/
Verity rachetée par Autonomy. Solution intégrée de
recherche et de catégorisation, IDOL K2 indexe de
multiples sources de données textuelles (courriels,
bases de données, sites Web) et référence
automatiquement les nouveaux documents. La
solution fusionne et catégorise les résultats issus de
recherches sur les index de sources d'information
Internet.
Autonomy/Verit IDOL K2
y
Martine Chaussade
32
Recherche et veille/outils internet
Digimind
Digimind Evolution
www.digimind.fr/
Solution intégrée composée d'une plate-forme de
base sur laquelle viennent se greffer des modules
additionnels. La surveillance de pages ou de sites
Web est possible, ainsi que des alertes par courriel
en fonction d'un niveau de modification
prédéterminé.Le Web invisible, les listes de
discussion et les groupes de discussion Usenet sont
également surveillables.
Plate-forme complète qui s’adresse plutôt aux
grands groupes
Martine Chaussade
33
Recherche et veille/outils internet
6 AUTOMATISATION DE LA VEILLE
6.1
Collecte automatique des données
Après l’audit des besoins, définir les actions suivantes :
Actions
Types de documents et de pages web à
surveiller
créer une base de connaissances
Outils
Annuaire (en phase initiale uniquement)
Moteur, méta-moteur
Aspirateur
Fréquence de surveillance
Agent d’alerte
Domaines d’actualités à suivre
Blog, médias, forum, liste de diffusion, FAQ,
autres sites spécialisés
Repérage de nouveaux sites
Placer des alertes sur des listes de liens
qualifiés (signets)
Interroger des sites spécialisés sur les
nouveautés, actualités
Abonnement à des services de veille sur profil Outils de push automatisé, courrier
électronique.
Filtration automatique des messages
électroniques
6.2
Définition de règles de gestion des messages
électroniques dans le logiciel de messagerie.
Traitement automatique
Les outils logiciels permettent d’avoir une vision globale des documents recueillis. Les mots
clés, concepts sont utilisés à l’aide de méthodes de calcul pour afficher des cartographies
plus ou moins sophistiquées. Autres traitements : la définition et le croisement de variables
pour découvrir des éléments d’évolution stratégique
6.3
Diffusion sélective des informations
Les outils logiciels « push » permettent de diffuser automatiquement et de façon
personnalisée les données issues des différentes analyses ou autres informations.
Les solutions/plate-formes de veille intègrent généralement des outils de diffusion sélective.
Aujourd’hui, le format RSS est très largement adopté comme outil push.
Martine Chaussade
34
Recherche et veille/outils internet
7 ORGANISMES DE SERVICES DE VEILLE
7.1
Infomédiaires
Nouveau métier du Web qui a pour activité l’agrégation de contenus (produits par d’autres)
pour une rediffusion vers le grand public ou les entreprises.
De façon générale, cet intermédiaire rassemble des informations sur les consommateurs
(quelquefois contre rémunération) pour les revendre, mais aussi sélectionne des produits et
services susceptibles de convenir à ces mêmes consommateurs.
7.2
Experts
•
Fonctionnement
Les sites experts recouvrent tous les domaines : santé, droit, finance, nouvelles
technologies…
Les sociétés se sont orientées vers des solutions globales de gestion des connaissances. Les
sites professionnels sont des services de veille.
•
Quelques sites
International
Sites professionnels
7.3
Askme
www.askme.com
Webhelp
www.webhelp.com
Cybion
www.cybion.fr
Veille
www.veille.com
Clubs de veille
Des clubs de veille sectoriels existent souvent dans les régions (voir les CCI).
Atelier BNP-Paribas
Cellule de veille générique du groupe.
www.atelier.fr/.
Lieu de veille depuis plus de 20 ans, l’atelier offre un ensemble de prestations.
7.4
Associations
Les SCIP
Association de professionnels créée en 1992 en France : SCIP France (association pour la
promotion de l’intelligence économique et concurrentielle) sur le même modèle que celle des
USA (1986), mais sont indépendantes. D’autres organisations similaires existent dans le
monde
http://www.scipfrance.org
AFDIE
Martine Chaussade
35
Recherche et veille/outils internet
Association française pour le développement de l’Intelligence Economique AFDIE
www.afdie.net/
FING
La Fing est une association qui a pour vocation de repérer, stimuler et valoriser l'innovation
dans les services et les usages des TIC. http://www.fing.org/
Depuis fin avril 2004 la FNIG a mis en ligne un service coopératif de veille et de publication
www.vcoop.net.
Martine Chaussade
36
Recherche et veille/outils internet
8 LIENS UTILES
www.abondance.com/ ou www.abondance.net/ ou
www.abondance.fr/
Recherche d’informations, référencement…, site
d’Olivier Andrieu
www.adit.fr/
Agence pour la diffusion de l’Information
technologique
www.afdie.net/
Association française pour le développement de
l’Intelligence Economique
www.anvar.fr/
Agence française de l’Innovation
www.cybion.fr
Recherche d'informations et veille sur Internet
www.ubifrance.fr/
Agence française pour le développement des
entreprises
www.enfin.com
recense un grand nombre de moteurs spécialisés
www.goov.org
Portail du service public Adminet et moteur de
recherche Auracom proposent un suivi
d’informations des sites institutionnels français.
www.ie-news.com/
Portail d’informations coonsacré à L’intelligence
économique
www.intelligence-center.com/ ou
http://c.asselin.free.fr/
Site de recherche d’informations, d’inteliigence
économique on-line et de veille sur le net
www.intelligenceonline.fr/
Système d'intelligence politique et économique
www.intelligence-economique.gouv.fr/
Site du gouvernement
www.lapasserelle.com/sm/formation_veille.html#rang
1
Liste d’outils de recherche et de veille sur internet
www.plan.gouv.fr/
Commissariat général au Plan : publie des documents
consacrés à l’Intelligence Stratégique
searchenginewatch.com/
Tout sur les moteurs de recherche : actualité,
comparatifs, fiches descriptives…
www.strategic-road.com
Répertoire thématique de sites Internet sur la
veille stratégique
www.touteleurope.fr/francais/
Nouveau portail sur l'Europe qui agrège un
ensemble d'informations issues de sources
hétérogènes (Blogs, sites officiels du
gouvernement, etc)
dadi.enssib.fr/
Liste bases de données gratuites (J.P.Lardy,
université Lyon, urfist)
www.veille.com
Présente l'ouvrage de Carlo Revelli l'Intelligence
stratégique sur Internet
veille.co.uk/
Annuaire de la veille
Martine Chaussade
37