cours recherche veille stagiaire
Transcription
cours recherche veille stagiaire
VEILLE STRATEGIQUE OUTILS INTERNET Martine Chaussade – Octobre 2007 SOMMAIRE 1 INTRODUCTION GENERALE........................................................................................................................................1 1.1 1.2 1.3 1.4 2 DIFFERENTES APPELLATIONS ...........................................................................................................................................1 TYPOLOGIES DE LA VEILLE ..............................................................................................................................................2 CLASSIFICATION DES INFORMATIONS ...............................................................................................................................2 VEILLE ET INTERNET .......................................................................................................................................................3 METHODOLOGIE DE VEILLE .......................................................................................................................................3 2.1 AUDIT DES BESOINS .........................................................................................................................................................3 2.2 COLLECTE DES DONNEES .................................................................................................................................................4 2.2.1 Sources formelles et informelles ...........................................................................................................................4 2.2.2 Typologies des sources...........................................................................................................................................4 2.2.3 Notes d’étonnement ...............................................................................................................................................6 2.2.4 Importance des réseaux personnels ......................................................................................................................6 2.2.5 Signaux faibles ......................................................................................................................................................6 2.3 TRAITEMENT DES DONNEES .............................................................................................................................................7 2.4 ANALYSE DES DONNEES ..................................................................................................................................................7 2.5 DIFFUSION DES RESULTATS..............................................................................................................................................7 3 PROTECTION DE L’INFORMATION ..........................................................................................................................8 3.1 3.2 4 DANGERS ........................................................................................................................................................................8 METHODOLOGIE DE PROTECTION ....................................................................................................................................8 RECHERCHE D’INFORMATIONS .................................................................................................................................9 4.1 ANNUAIRES .....................................................................................................................................................................9 4.1.1 Fonctionnement.....................................................................................................................................................9 4.1.2 Annuaires anglophones.......................................................................................................................................10 4.1.3 Annuaires francophones .....................................................................................................................................10 4.1.4 Fiche Open Directory ..........................................................................................................................................11 4.2 MOTEURS DE RECHERCHE .............................................................................................................................................12 4.2.1 Fonctionnement...................................................................................................................................................12 4.2.2 Stratégie de la recherche .....................................................................................................................................12 4.2.3 Moteurs de recherche anglophones ....................................................................................................................13 4.2.4 Moteurs de recherche francophones...................................................................................................................13 4.2.5 Fiche Yahoo France............................................................................................................................................14 4.2.6 Fiche Google........................................................................................................................................................15 4.2.7 Fiche Exalead ......................................................................................................................................................17 4.2.8 Fiche Ask.com .....................................................................................................................................................18 4.3 META-MOTEURS ............................................................................................................................................................19 4.3.1 Sites web (on line)................................................................................................................................................19 4.3.2 Logiciels (off line)................................................................................................................................................20 4.4 WEBLOGS ET FILS RSS ..................................................................................................................................................20 4.4.1 Weblogs................................................................................................................................................................20 4.4.2 Fils RSS ou flux RSS (RSS feeds).......................................................................................................................21 4.4.3 Agrégateurs/lecteurs RSS ....................................................................................................................................22 4.4.4 Outils de recherche des weblogs et des fils RSS .................................................................................................22 4.5 LISTES DE DIFFUSION, FORUMS (GROUPES DE DISCUSSION)............................................................................................23 4.6 LE WEB INVISIBLE .........................................................................................................................................................24 4.7 LES BREVETS .................................................................................................................................................................28 5 AGENTS « INTELLIGENTS »....................................................................................................................................29 5.1 5.2 5.3 5.4 5.5 6 TECHNOLOGIES « PULL » ET « PUSH »...........................................................................................................................29 AGENTS D’ALERTE ........................................................................................................................................................29 AGENTS TECHNOLOGIE PUSH AUTOMATISEE ..................................................................................................................30 ASPIRATEURS DE SITE....................................................................................................................................................31 SOLUTIONS DE VEILLE ...................................................................................................................................................32 AUTOMATISATION DE LA VEILLE ........................................................................................................................34 6.1 6.2 COLLECTE AUTOMATIQUE DES DONNEES .......................................................................................................................34 TRAITEMENT AUTOMATIQUE .........................................................................................................................................34 Martine Chaussade 6.3 7 ORGANISMES DE SERVICES DE VEILLE..............................................................................................................35 7.1 7.2 7.3 7.4 8 DIFFUSION SELECTIVE DES INFORMATIONS ....................................................................................................................34 INFOMEDIAIRES .............................................................................................................................................................35 EXPERTS........................................................................................................................................................................35 CLUBS DE VEILLE ..........................................................................................................................................................35 ASSOCIATIONS...............................................................................................................................................................35 LIENS UTILES ................................................................................................................................................................37 Martine Chaussade Recherche et veille/outils internet 1 INTRODUCTION GENERALE La maîtrise de l’information stratégique est aujourd’hui une nécessité absolue. Veiller c’est surveiller pour anticiper, effectuer un transfert de connaissances, s’adapter… La veille peut fournir des éléments essentiels nécessaires à la prise de décision : sortie d’un nouveau produit concurrent, d’une nouvelle technologie, implantation géographique d’une entreprise de produits complémentaires, image de l’entreprise…Elle révèle des menaces ou des opportunités de développement « celui qui sait plus rapidement agit plus vite ». Elle est toujours orientée vers le futur. Les informations recueillies permettront de prendre des décisions stratégiques qui prendront effet dans plusieurs mois selon le métier ou l’activité de l’entreprise. Cette démarche nécessite également une nouvelle forme de management, une structure transversale et un partage des informations. Elle permet d'accompagner la gouvernance d'entreprise.L’intelligence économique est restée de nombreuses années l’apanage de grands groupes. Elle gagne peu à peu du terrain depuis la publication en juin 2003 du rapport réalisé à la demande du Premier ministre par le député Bernard Carayon 1. Puis en janvier 2004 Alain Juillet est nommé Haut responsable à l’intelligence économique auprès du Premier ministre. Régulièrement des initiatives nationales, régionales sont annoncées. Internet donne accès à un nombre d’informations en croissance exponentielle et l’entreprise se doit de rechercher la pertinence. Avec une méthodologie associée à l’utilisation d’outils (depuis les plus simples et gratuits aux plus sophistiqués et onéreux) chaque entreprise doit pouvoir trouver une solution adéquate à ses besoins. 1.1 Différentes appellations Veille stratégique, Intelligence économique, Intelligence stratégique Quelques définitions : « La veille stratégique est le processus informationnel volontariste par lequel l'entreprise recherche des informations à caractère anticipatif concernant l'évolution de son environnement socio-économique dans le but de se créer des opportunités et de réduire ses risques liés à l'incertitude. Parmi ces informations figurent des signaux d'alerte précoce. »2 « L’intelligence économique peut être définie comme l’ensemble des actions de recherche, de traitement et de diffusion (en vue de son exploitation) de l’information utile aux acteurs économiques » 3. « L’approche stratégique de l’intelligence économique répond au besoin de prendre une décision . Elle répond à un besoin de savoir un minimum d’information nécessaire et d’agir pour progresser vers une situation plus favorable. » 4 L’intelligence économique est un processus qui se construit et un moyen de gagner plus ou de perdre moins (selon Yves Michel MARTI). 1 Rapport Carayon : « Intelligence économique, compétitivité et cohésion sociale » www.guerreco.com 3 Commissariat du Plan 4 Rapport Cigref (Club informatique des grandes entreprises) mars 2003 « Intelligence économique et stratégique » 2 Martine Chaussade 1 Recherche et veille/outils internet Le concept d’Intelligence économique recouvre une notion plus vaste que la veille stratégique, c’est l’aboutissement d’un long processus de veille. Pour certains ces termes définissent des notions quasi équivalentes. Ils décrivent une démarche active, collective pour collecter, traiter et diffuser des informations fiables et pertinentes afin de faciliter les prises de décision stratégiques. 1.2 Typologies de la veille La veille se décline en plusieurs typologies : veille stratégique, veille économique, veille environnementale, veille concurrentielle, veille technologique… Quelques exemples : Veille stratégique : c’est l’ensemble des activités de veille, approche globale Veille technologique : nouveau procédé de fabrication nouveau produit ou service nouvelle technologie Veille économique : développement ou récession d’u marché, d’une région axes stratégiques de développement définis par l’Etat aides financières, subventions Veille environnementale : réglementations, normes sur tous les facteurs susceptibles d'influencer directement ou indirectement l'activité de la société Veille commerciale et concurrentielle : marché des concurrents implantation géographique publication de rapports annuels Nous aborderons la veille sous un aspect global. La veille technologique présente la caractéristique d’être pratiquée depuis longtemps. Pour certaines entreprises la veille sera globale, pour d’autres, certaines veilles sont privilégiées selon les besoins à chaque entreprise. 1.3 Classification des informations Information blanche Publique et accessible, pas de sécurisation particulière Recherche avec les outils classiques. Information grise Se trouve de manière indirecte ou détournée, information sensible d’accès légal Utilisation des techniques avancées de recherche, groupes de discussion, listes de diffusion Information noire Information sous haute sécurisation, relève de l’espionnage industriel. Source : www.decisionnel.net/veille/veille.htm Martine Chaussade 2 Recherche et veille/outils internet 1.4 Veille et Internet Internet un formidable outil pour la veille Sources du monde accessibles en permanence, en temps réel Internet permet des échanges auparavant impossibles ou difficilement réalisables Caractéristiques des Informations sur Internet Abondance Difficilement Rapidité accessibles Constamment modifiées Pas toujours fiables accès Bon marché 2 METHODOLOGIE DE VEILLE La 1ère étape concerne la réflexion autour de la problématique de la veille et la mise en place d’une méthodologie avant d’utiliser les outils adéquats. Etape essentielle, car il est nécessaire ensuite d’adapter les ressources aux besoins. Le projet devrait produire des résultats tangibles, si possible, rapidement. Une approche par métier, par secteur d’activité sera plus limitée mais plus facile à mettre en œuvre. Après les premiers résultats, l’approche transversale apportera une valeur complémentaire. 2.1 Audit des besoins Il faut répondre à des questions essentielles : Quel type de veille ? Que chercher, que surveiller ? Quelles sont les informations que l'on n'arrive pas à connaître ? Préciser la problématique Etablir le lien impérativement avec la stratégie de l’entreprise Formuler toutes les hypothèses de recherche pour répondre aux questions des opérationnels, pour surveiller les concurrents, fournisseurs … surveiller les domaines sensibles (nb en général compris entre 3 et 7) D’autres actions de recherche ponctuelles peuvent être déclenchées pour répondre à un besoin précis. recherche d’indicateurs Quels sont les mots clés ? domaines (technique, économique, social…), pertinence permet de constituer des arborescences et un thesaurus technique (recherche puis classement information) Quelles peuvent être les sources ? informations blanches, grises Martine Chaussade 3 Recherche et veille/outils internet vérifier les informations déjà détenues en interne Quels sont les moyens de veille ? presse spécialisée, contacts, salons, internet… Quel budget peut-on y consacrer ? investissement humain mais aussi matériel et logiciel sans oublier le coût de maintenance Quel(s) niveau(x) de hiérarchie doit accéder aux informations ? employés, cadres, direction générale Quelle structure adopter pour la cellule de veille ? par direction (commercial, communication…), ou structure transversale pour une veille plus globale. Etablir un plan de veille "pilote" qui pourra être décliné pour chaque sujet. La phase de ciblage peut être facilitée par l’utilisation d’un système de type « mind mapping » (ex. Mind Manager). La définition de l’environnement de l’entreprise permet de cibler la recherche. Questions avant toute recherche 1. 2. 3. 4. 2.2 Collecte des données 2.2.1 • Où trouver l’information le plus rapidement ? Dans l’entreprise, en utilisant le téléphone, internet … Combien de temps accorder à la recherche ? Quels sont les mots clés pertinents ? Quelle doit être la meilleure source sur internet ? Sources formelles et informelles Sources formelles Presse, livres, autres médias, banques de données et CD-ROM, brevets, sources d’informations légales, études publiques réalisées par des prestataires • Sources informelles Concurrents, fournisseurs, sous-traitants, missions, salons/expositions, colloques/congrès/clubs, étudiants/stagiaires/thésards, candidats à l’embauche, comités divers (organisations professionnelles...), sources internes à l’entreprise... 2.2.2 Typologies des sources • Organismes publics Martine Chaussade 4 Recherche et veille/outils internet • ADIT (Agence pour la Diffusion de l’Information Technologique) www.adit.fr/ ARIST (Agence Régionale pour l’Information Scientifique et Technique) (n’existe plus à Bordeaux) www.arist.fr/ INSEE (Institut National de la Statistique et des Etudes Economiques) www.insee.fr/ Agence française pour le développement international des entreprises (anciennement CFCE Centre Français du Commerce Extérieur) www.ubifrance.fr/ Groupements professionnels Centre de documentation des CCI Chambre de commerce et d’industrie à l’étranger • Organisations et syndicats sectoriels • Consultants et experts • Bases de données Pour sélectionner les bases de données adéquates, il existe un annuaire qui les recense toutes : l’ADBS www.adbs.fr/ association des professionnels de l’information et de la documentation. L’accès aux différentes bases de données se fait par l’intermédiaire de serveurs tels que : QUESTEL et ORBIT tous deux gérés par France Télécom : www.questel.orbit.com/fr/ DIALOG, DATASTAR, serveurs américains... LEXIS-NEXIS www.lexisnexis.com L’Européenne de données (filiale du groupe OR Télématique) www.ort.fr/ Services proposés par Qwam Quelques banques de données ABES Agence bibliographique de l’Enseignement supérieur www.abes.fr/ KOMPASS base de données entreprises Martine Chaussade www.kompass.fr/ 5 Recherche et veille/outils internet Registre du commerce www.euridile.inpi.fr/ Recherche dans le Registre National du Commerce et des Sociétés, le Fichier du Cadastre des Sociétés Marques INPI : www.icimarques.com/ Xerfi études de marché www.xerfi.fr/ • Brevets (voir § dans Recherche d’informations) • Veille normative • Manifestations Les salons et colloques sont des lieux à ne pas manquer pour ceux qui veulent suivre l’évolution d’un secteur. Il est nécessaire de préparer et de cibler au maximum sa recherche d’informations. Cela permet de collecter les informations les plus récentes, de surveiller les concurrents,... 2.2.3 Notes d’étonnement C’est un document utilisé par des personnes habituées à la collecte d’informations pour rendre compte de renseignements intéressants après la visite de salons, la participation à un colloque... 2.2.4 Importance des réseaux personnels • Créer son réseau à l’extérieur de l’entreprise, à l’intérieur associations professionnelles, des anciens, extra-professionnelles (ex : Rotary, Lion’s club...), laisser des cartes de visite mobilité dans l’entreprise, stages de formation, rencontres autour d’un café... • Entretenir son réseau : garder le contact, échange d’informations cartes de vœux, fêtes veiller à la diversité et au nombre des relations. 2.2.5 Signaux faibles Autre appellation utilisée : « signe d’alerte précoce » « Nous appelons signe d’alerte précoce une information dont l’interprétation donne à anticiper qu’un événement susceptible d’être important pour l’avenir d’une firme pourrait s’amorcer. » 5 5 « Signaux faibles et méthode cible » Rapport H.Lesca et J-C. Castagnos - Mai 2000 Martine Chaussade 6 Recherche et veille/outils internet 2.3 Traitement des données Objectifs : rejeter les informations peu intéressantes (bruit) vérifier les informations catégoriser les informations utiles Parmi toutes les données recueillies, il faut extraire les informations les plus pertinentes, les trier automatiquement. Le chargé de veille doit mettre en place des filtres, vérifier les sources et croiser les informations. Il est nécessaire d’effectuer une catégorisation des informations en fonction des thématiques de veille définies précédemment. Les thèmes peuvent devenir des mots-clés (tags ou méta-données) qui seront utilisés pour l’indexation des documents. L’intervention humaine reste nécessaire et apporte sa valeur ajoutée. Une grille de notation des informations par fonction traitée avec indication des sources peut aider au traitement et à la sélection des sources. 2.4 Analyse des données Cette étape permet de transformer les informations en connaissances. Partie la plus ardue du processus. L'analyste doit connaître le domaine d'activité étudié, être expert sur le sujet. Il doit avoir une vision structurée et transversale de l’entreprise ainsi qu'un esprit d’analyse et de synthèse. Il est possible de faire appel à un expert extérieur à l'entreprise. Ses analyses pertinentes sont essentielles pour la réussite d’un processus de veille. Les informations traitées doivent dégager des pistes de recherche suffisamment pertinentes, des thèmes de réflexion, identifier des tendances. Les documents élaborés (fond et mise en forme) permettent de visualiser les réponses aux objectifs fixés lors de la 1ère étape : notes de synthèse, tableau de bord, étude, cartographie.. 2.5 Diffusion des résultats La diffusion sélective (en fonction des sujets) dans l’entreprise constitue la dernière étape. Le système d’information peut permettre un système d’abonnement sur profil. Souvent cette diffusion sélective s’effectue via un Intranet sur un site portail d’accès personnalisé. Autres outils sous forme numérique : messagerie, groupware, interface web personnalisée (EIP Enterprise Information Portail exemple MyLivelink), flux RSS (dernier type d’outil du push qui permet la syndication de contenu – cf.§ 5.4.) Outils classiques utilisés : revue des presse journal interne Martine Chaussade peuvent être diffusés sous forme numérique 7 Recherche et veille/outils internet dossier d’information réunion d’information orale Ultime étape à ne pas négliger : Vérifier l’utilisation de l’information diffusée (feed-back de la part de l’utilisateur) permet d’améliorer la qualité des futures informations, de réorienter les recherches peut entraîner des actions correctrices, des projets. Cette veille doit se traduire en décisions opérationnelles (partie difficile et importante du processus). Il faut savoir ensuite passer à l’action. Exemple : programmation d’une réunion mensuelle pour travailler sur les informations diffusées et prendre des décisions. 3 PROTECTION DE L’INFORMATION 3.1 Dangers L’information est de plus en plus recherchée par tous, les risques et menaces augmentent, il faut donc la protéger. Un des aspects de l'Intelligence Economique est l'amélioration de la protection des informations. 2 types de dangers : • Accidentel : incendie, inondation, effacement des données par erreur... • Intentionnel : vol de données (par un employé ou une personne extérieure à l’entreprise), sabotage, intrusion dans le système d’information via Internet, désinformation... 3.2 Méthodologie de protection Avoir une politique de sécurité globale qui comprend la sensibilisation du personnel et les procédures techniques de protection de l’information avec une vision à la fois proactive et réactive. L'entreprise doit également suivre les risques en temps réel. Etablir un ensemble de règles claires de classification et d'usage des informations (ex. : ne pas photocopier…). Faire une réflexion sur la stratégie de l’entreprise, toutes les informations ne sont pas stratégiques. Attribuer à chaque information un critère de diffusion : diffusion globale ou restrictive. Repérer les circuits d’informations. Etablir un plan de restauration du système d’information avant un problème quelconque. Sensibiliser le personnel : informer des règles de protection de l’information. Lister les méthodes que vos adversaires utiliseraient pour obtenir des informations sur votre entreprise. Prendre les mesures nécessaires afin que ces méthodes soient inefficaces. Martine Chaussade 8 Recherche et veille/outils internet 4 RECHERCHE D’INFORMATIONS Le Web comprendrait environ 11,5 milliards de pages pour la partie «visible » c.a.d. indexable en janvier 2005 selon une étude menée par deux chercheurs des universités de Pise (Italie) et de l’Iowa (Etats-Unis). Aucune liste ne recense toutes les adresses de sites6. Selon cette même étude 9,4 milliards seraient « trouvables » en utilisant les moteurs de recherche majeurs. La croissance annuelle serait de plus de 15 millions de site (17,5 millions en 2005 selon l’éditeur britannique Netcraft spécialisé en analyses et statistiques réseau). La recherche d’informations est ainsi extrêmement difficile à réaliser. Au-delà de l’abondance d’informations, celles-ci sont parfois difficilement accessibles, modifiées sans cesse et ne sont pas toujours fiables. • Typologie des outils de recherche Deux grands types d’outils : les annuaires et moteurs. Mais ces dernières années les moteurs ont pris une place prépondérante sur le marché de la recherche au détriment des annuaires toujours utiles. Autres types disponibles : Méta-moteurs, fils RSS, agents de veille Le développement de « portails » permet de personnaliser l’accès aux sources d’information. L’interrogation sur le web s’effectue au moyen de requête qui doit être la plus précise possible afin d’obtenir des réponses pertinentes. L’utilisation de tags (mots-clés du web 2.0) permet également d’effectuer des recherches. Recommandations : Tous les outils n’ont pas les mêmes critères de classement pour l’affichage des pages de résultats, ils ne révèlent pas toujours l’information pertinente. Les meilleurs résultats sont obtenus en combinant différents moyens. 4.1 Annuaires 4.1.1 Fonctionnement Avec cet outil, les sites sont classés par thèmes et répertoriés par l’intervention humaine. L’indexation se fait soit suite à une demande de référencement, soit après repérage par l’équipe de l’annuaire. L’annuaire peut être généraliste ou thématique. L’internaute effectue la recherche par thème mais également à l'intérieur d'un corpus (mot/expression). Quant à l’annuaire, il recherche les sites sur leur description (faite par l’équipe de l’annuaire) et/ou sur d’autres zones (titre, URL…), et non sur le contenu. 6 Les adresses de sites mentionnées dans ce guide peuvent ne plus exister le jour de votre consultation. Lorsque l’adresse est composée de plusieurs pages, remonter dans l’arborescence, si nécessaire jusqu’à la racine. Martine Chaussade 9 Recherche et veille/outils internet 4.1.2 Annuaires anglophones Quelques outils : www.lycos.com/ Looksmart www.looksmart.com/ Open Directory dmoz.org/ Yahoo! www.yahoo.com 4.1.3 Annuaires francophones Quelques outils : Ari@ne www.ariane6.com/moteurs.htm Lycos France www.lycos.fr/dir/ Nomade www.nomade.fr/ Open Directory France dmoz.org/World/Fran%c3%a7ais/ Yahoo France fr.dir.search.yahoo.com/dir Yahoo! France (portail) www.yahoo.fr Enfin www.enfin.fr/ Annuaires spécifiques : Martine Chaussade Portail d’informations généralessur les institutions, services publics français www.adminet.fr/ Annuaire internet des sites professionnels www.indexa.fr/ Annuaire spécialisé : 700 sites sélectionnés sur l’économie et le management www.ccip.fr/rime/ www.adminet.com/index_fr.html 10 Recherche et veille/outils internet 4.1.4 Fiche Open Directory Services Annuaire dmoz.org/ dmoz.org/World/Fran%c3%a7ais/ Annuaire communautaire alimenté par des milliers de contributeurs, chacun étant responsable d'une rubrique pour laquelle il indexe des adresses Web Propriétaire AOL/Netscape Champs de recherche Environ 4,3 millions de sites en anglais (avril 2007), 209 000 sites pour la partie francophone (juillet 2007) source Wikipedia • Entrer la requête utiliser les opérateurs booléens, si nécessaire astérisque, parenthèses (cf. tableau page suivante). • Limiter la recherche par la sélection de catégories ou de sites. • Par défaut les résultats comprendront tous les mots de la requêtes, activer si nécessaire. Type recherche Opérateur Plusieurs mots Action Ajout automatique de l’opérateur AND entre les mots saisis. Recherche d’une expression «» Entrer l’expression entre les guillemets Ne pas utiliser en recherche avancée sauf si un opérateur booléen doit être considéré comme un mot clé Recherche sur plusieurs mots + - Inclure obligatoirement le mot qui suit exclure obligatoirement le mot qui suit Avec mots clés u: Recherche d’un mot contenu dans l’adresse url (ex. u:veille) Martine Chaussade 11 Recherche et veille/outils internet spéciaux 4.2 d: Recherche d’un mot contenu dans le descriptif du document (ex. d:veille)) t: Recherche d’un mot contenu dans le titre du document (ex. t:veille) c: Recherche d'un mot dans l'intitulé d'une catégorie Moteurs de recherche 4.2.1 Fonctionnement Ils répertorient automatiquement les sites Web, indexent leurs adresses au sein d’une base propriétaire ainsi que leur contenu et les liens hypertextes vers d’autres sites, à l'aide d'un robot (crawler). Le logiciel du moteur parcourt l’index pour identifier les mots correspondant à votre question, trie les pages trouvées avant d’afficher le résultat. Les pages graphiques (Flash) ou dynamiques (CGI, CFM, ASP,...), fichiers au format PDF etc. ne sont pas souvent pris en compte sauf exception (cf. web invisible) par les moteurs de recherche. Règles générales pour la recherche : Ne pas saisir les caractères accentués, la recherche s’effectue normalement sur ces caractères accentués ou non. Ne pas saisir de lettres en majuscule, la recherche doit s’effectuer à la fois sur les minuscules et majuscules. 4.2.2 Stratégie de la recherche Identifier les mots clefs nécessaires à la recherche (synonymes, concepts proche des mots clefs). Utiliser les recherches avancées avec opérateurs booléens, il est donc nécessaire de se familiariser avec les moteurs sélectionnés et leur syntaxe. Rechercher dans les adresses URL, dans le titre d’un document. Utiliser les meilleurs moteurs, lancer les requêtes sur au moins 3 d’entre eux. Sauvegarder les sites intéressants dans les signets • Recherche de mots clés : Un bon mot-clé est suffisamment pertinent et peu fréquent pour que le moteur de recherche l'ait indexé peu de fois. De nouveaux outils proposent des classements de pages par dossier, par thème ou un affichage graphique de liens sémantiques. Cela permet d’enrichir la liste de mots clés pour une recherche. Martine Chaussade 12 Recherche et veille/outils internet 4.2.3 Moteurs de recherche anglophones Quelques outils : Altavista www.altavista.com AlltheWEb (Fast) www.alltheweb.com/ Askjeeves www.ask.com/ Gigablast www.gigablast.com/ Google www.google.com/ 4.2.4 Moteurs de recherche francophones Quelques outils : Martine Chaussade Altavista France www.altavista.fr/ AOL France www.aol.fr/ Exalead www.exalead.com/ Google France www.google.fr/ Hotbot France www.hotbot.fr/ Microsoft www.live.com/ Voila www.voila.fr/ Yahoo ! Search Technology fr.search.yahoo.com/ 13 Recherche et veille/outils internet 4.2.5 Fiche Yahoo France Page recherche avancée Services Annuaire fr.dir.search.yahoo.com/dir Portail www.yahoo.fr Moteur fr.search.yahoo.com/ Nombreux services disponibles : info, finance, loisirs, communication, achats Champs de recherche 2 millions en anglais Index mis à jour toutes les 4 à 6 semaines • Entrer la requête utiliser si nécessaire l’astérisque, les guillemets (cf. tableau page suivante). • Sélectionner une ou plusieurs options. • Si souhaité limiter la recherche aux sources les plus récentes. Type recherche Opérateur Plusieurs mots Action Ajout automatique de l’opérateur ET entre les mots saisis. Recherche d’une expression «» Entrer l’expression entre les guillemets Recherche sur plusieurs mots + - Inclure obligatoirement le mot qui suit exclure obligatoirement le mot qui suit Martine Chaussade 14 Recherche et veille/outils internet 4.2.6 Fiche Google Services Moteur de recherche www.google.com/ www.google.fr/ scholar.google.com/ site spécialisé sur la recherche de documents scientifiques et universitaires Champs de recherche Plus de 8 milliards de documents Rafraîchissement index : 4 semainesForums de discussion , news, fichiers image, vidéo et audio (50 millions d'images, de séquences vidéo et de clips audio), produits divers Sélectionne les pages en fonction du nombre de liens pointant vers elles et de la pertinence de ces liens avec les mots clés. Page recherche avancée • Entrer la requête dans les zones Pages contenant. • Autres options possibles : choix de la langue format de fichier recherche sur date (3 derniers mois, 6 derniers ou année écoulée) emplacement dans la pagerecherche de page sur le même domaine ou activité qu’un site adresses url de sites à inclure ou exclure recherche de pages similaires ou ayant des liens avec un site Martine Chaussade 15 Recherche et veille/outils internet Type recherche Opérateur Plusieurs mots Recherche d’une expression Action Ajout automatique de l’opérateur ET entre les mots saisis. «» Entrer l’expression entre les guillemets Certains caractères dont les traits d'union, les obliques, les points, les signes d'égalité et les apostrophes fonctionnent comme des guillemets Mots stop Ignore les caractères et mots courants, certains chiffres et certaines lettres uniques, ils sont nommés "mots stop" (ex. cellule de veille pour recherche sur cellule et veille) Utilisez le signe "+" pour inclure des mots stop dans la recherche , à faire précéder d'un espace (ex. « OS/+2 pour recherche OS/2) Recherche simple + - Bouton J'ai de la chance Avec mots clés spéciaux Inclure exclure Charge automatiquement la 1ère page web retournée par la requête inurl: allinurl: Recherche d’un mot contenu dans l’adresse url (ex. inurl:veille) Recherche de plusieurs mots contenus dans l’adresse url (ex. allinurl:veille urfist) intitle: allintitle: Recherche de mots contenus dans le titre puis dans la page (ex. intitle:veille outils recherche veille dans le titre puis outils dans la page) Recherche de plusieurs mots contenus dans le titre (ex. inurl:veille outils recherche veille et outils dans le titre) site Indique le nb de pages indexées pour un site. Ex : site :www.ibm.com link: Recherche les pages ayant un lien vers l’URL précisée (ex. link:www.abondance.fr) info: Recherche d’informations à propos de l’URL précisée (ex. info: www.abondance.fr) related: Recherche de pages similaires à l’URL précisée (ex. related: www.abondance.fr) cache: Recherche de la version archivée (cache) de l’URL précisée (ex. cache: www.abondance.fr) Martine Chaussade filetype: Recherche sur le type de fichier (ex. : filetype:pdf) define: Recherche sur les mots (ex. : define:veille permet de trouver des définitions du mot veille) 16 Recherche et veille/outils internet 4.2.7 Fiche Exalead Services Moteur de recherche www.exalead.fr/search Champs de recherche 8 milliards de pages (octobre 2006) Index mis à jour toutes les 4 semaines Forums de discussion , news, fichiers image, vidéo et audio (50 millions d'images, de séquences vidéo et de clips audio), produits divers. Page Recherche avancée • Dans la partie Find pages, les listes déroulantes autorisent un grand choix de la place des mots dans les pages, titre ou url d'un site. • Les zones suivantes permettent d'affiner les recherches. Type recherche Opérateur Action Recherche d’une expression «» Entrer l’expression entre les guillemets Opérateurs booléens ET ou + Recherche de documents comportant tous les mots - (sauf) Rejette les documents comportant l’expression suivant l’opérateur site: Recherche d’un mot contenu dans les pages d'un site (ex. +recherche +site:abondance.fr) title: Recherche d’un mot contenu dans le titre du document (ex. title:veille) language: Recherche sur une langue (ex. : veille language:fr) Recherche avancée mots clés spéciaux Martine Chaussade 17 Recherche et veille/outils internet 4.2.8 Fiche Ask.com Services Moteur de recherche www.ask.com/ fr.ask.com/ version française bêta (depuis déc 2005) Champs de recherche 5,3 milliards de pages Index mis à jour toutes les 4 semaines Forums de discussion , news, fichiers image, produits divers Nouveau moteur d'images (janvier 2006) Nouvelles fonctionnalités dans les pages de recherche du site américain (décembre 2005) Page Recherche avancée • Entrer la requête dans les 4 premières zones suivant les opérateurs choisis. • Autres options possibles : emplacement : page, titre ou url choix de la langue domaine région du monde recherche sur date Type recherche Opérateur Action Plusieurs mots ET ou + Ajout automatique de l’opérateur ET entre les mots saisis. OR Recherche de documents comportant au moins l’un des mots Exclusion SAUF - Rejette les documents comportant l’expression suivant l’opérateur Recherche d’une expression «» Entrer l’expression entre les guillemets Certains caractères dont les traits d'union, les obliques, les points, les signes d'égalité et les apostrophes fonctionnent comme des guillemets Martine Chaussade 18 Recherche et veille/outils internet Avec mots clés spéciaux 4.3 inurl: Recherche d’un mot contenu dans l’adresse url (ex. inurl:veille) intitle: Recherche de mots contenus dans le titre (ex. intitle:veille recherche veille dans le titre) Méta-moteurs Utilisent plusieurs moteurs simultanément. Ils ne maintiennent pas d'index de sites mais lancent une requête d'information simultanée sur plusieurs moteurs de recherche du Web et centralisent les résultats. Sous la forme d'une interface Web ou en tant que logiciels clients. • Fonctionnalités suivant les logiciels : simple automatisation de la consultation parallèle de plusieurs moteurs choix des moteurs à lancer en fonction de la nature de l'information demandée traitement des informations récoltées. Sont des outils capables de lancer plusieurs moteurs de recherche sur le Web en fonction de la nature de l'information demandée et de synthétiser les résultats plus ou moins intelligemment : dédoublonnent et trient les premiers résultats des moteurs. Peuvent comprendre des fonctions de veille, avec la possibilité de programmer la recherche automatique d'une information (surveillance du contenu d'un site et alerte automatique lorsque celui-ci est modifié). Ils permettent souvent la navigation off-line et offrent des options de gestion de l'information recueillie, plus ou mois avancées. 4.3.1 Sites web (on line) Quelques outils : Produit Site web Commentaires Dogpile (USA) WebFetch (Europe) www.dogpile.com/ www.webfetch.com/ Recherche dans 10 moteurs de recherche, avec la possibilité de rechercher par thème (,mp3,images,web…) Iboogie www.iboogie.com/ Outil avec une interface simple et dépouillée. Classement de résultats dans des dossiers thématiques Ixquick www.ixquick.com Recherche dans 11 moteurs de recherche, avec la possibilité de rechercher par thème ( infos, images,web ) de plus celui-ci élimine les doublons Kartoo www.kartoo.com/ Présente les résultats sous forme de carte. Meta-crawler www.metacrawler.com ou www.go2net.com/ pas de base de données locale - interroge plusieurs moteurs : Lycos, Infoseek, WebCrawler, Excite, AltaVista, Thunderstone, The Mining Co., Looksmart, and Yahoo. - organise les résultats en un format unique , les range par pertinence Open Text www.queryserver.com/web.ht m Recherche dans 10 moteurs, classe les réponses par catégorie Martine Chaussade 19 Recherche et veille/outils internet Polymeta polymeta.com/ Synthétise ses résultats dans un système de clustering et affiche des images directement dans la page du résultat. Search.com www.search.com/ Point d'accès à plus de 800 moteurs de recherche, guides, magasins, archives de Usenet et de news, bibliothèques de logiciels - Mot-clé envoyé simultanément aux moteurs de recherche - Résultats rassemblés et organisés selon la pertinence Surfwax www.surfwax.com Propose quatre types d’offres payantes. L’offre PERSONAL permet, grâce à une formule gratuite, de découvrir la plupart des fonctionnalités. Vivisimo www.vivisimo.com/ Interroge plusieurs moteurs et classe ensuite les résultats dans des dossiers différents par thèmes Webcrawler www.webcrawler.com Recherche par catégorie, également fonction recherche sites de news Webbrain www.webbrain.com Affichage des résultats sous forme de cartographie, permet de faire des associations de concepts 4.3.2 Logiciels (off line) • Principes et avantages : Ces outils peuvent être classés dans la catégorie "d’agents intelligents". Ont des fonctions avancées, surtout par leurs modes de traitement et de restitution, plus ou moins sophistiquées. Une partie cliente, l’interface d'interrogation et de consultation est installée sur le disque dur. Certains outils seront étudiés dans la partie Agents intelligents. Produit Site web Prix ht Commentaires Copernic www.copernic.com Webferret www.webferret.com/ Gratuit 2 versions. Choix des moteurs interrogés, du nombre de résultats par page, possibilité de 29,95$ filtrer les réponses. Webseeker www.bluesquirrel.com/ products/webseeker 29,95$ Utilise plus de 100 moteurs ou annuaires, élimine les doublons et liens caduques, ajout de moteurs possible, opérateurs booléens, mise à jour automatique des liens. (démonstration en téléchargement) 4.4 Basic : gratuite De la version gratuite permettant de faire de la Personal : 29,95€ recherche à la version professionnelle Professional : permettant de faire de la veille. 79,95€ Weblogs et fils RSS 4.4.1 Weblogs Blog, Blogue (contraction de « web » et de « log »), carnet de bord Suite d'articles datés diffusés sur le web, avec une mise à jour fréquente. Le weblog est un outil simple qui permet d'écrire sans se soucier de la technique (HTML, FTP...): un simple navigateur internet et un accès à Internet suffit. Le terme anglais weblog signifie Martine Chaussade 20 Recherche et veille/outils internet littéralement journal de bord sur le web, le terme québecois est webillard (dérivé de babillard, la traduction de BBS). Les articles sont datés (classement sur la date par ordre décroissant) et signés, les lecteurs peuvent y ajouter des commentaires. Les weblogs peuvent être écrits par des experts, consultants, membres d’entreprise (voir page suivante). Les répertoires et les moteurs sont les 2 outils les plus simples pour trouver des blogs. Ces weblogs comprennent beaucoup de liens et permettent de découvrir d'autres ressources d'intérêt, qu’il s’agisse de weblogs ou non.. Exemples de weblogs : Weblog Commentaires www.urfist.info/ Créé et animé par le réseau des URFIST (Unité Régionale de Formation à l'Information Scientifique et Technique), il traite de l'actualité des sciences de l'information et du monde de la documentation et des bibliothèques joueb.com/outilsfroids/infos.sh tml A pour but d'informer les "knowledge workers" des nouveaux outils, usages, methodologies, concepts, pouvant les aider à améliorer leur productivité personnelle au quotidien. www.verbalkint.net/ Intelligence économique et internet www.itligentia.com/ Veille et recherche d’informations 4.4.2 Fils RSS ou flux RSS (RSS feeds) RSS (Real Simple Syndication ou syndication vraiment simple) Ils permettent de surveiller un weblog et sont générés automatiquement. Le format de données XML utilisé comprend les principales informations (titre, description, auteur, date) sur les modifications récentes des messages publiés sur un blog. Comme les blogs, les fils RSS figurent souvent sur les sites web qui proposent des actualités. Compte tenu de sa simplicité, c'est actuellement le format web qui se développe le plus vite pour l'export et l'exploitation d'actualités. Les flux RSS sont utiles à tous les sites fréquemment mis à jour. Ils ne sont pas réservés à des articles ou des messages et peuvent contenir aussi un lien pointant vers une nouvelle entrée dans un catalogue, etc. Le podcasting permet de lire en ligne des fichiers audio à partir de fils RSS. • Créer un flux RSS Les outils de gestion de contenu ou de weblog incluent souvent une fonctionnalité permettant de produire les flux RSS correspondant aux dernières informations entrées sur le site. • Lire un flux RSS Il faut un logiciel qui convertisse le XML en HTML : un "agrégateur de news" ou "lecteur RSS". Ces lecteurs RSS proposent des listes de flux RSS auxquels il est possible de Martine Chaussade 21 Recherche et veille/outils internet s'abonner et des moyens de classement de ces flux. Le logiciel peut avoir sa propre interface ou s’intégrer à un client de messagerie comme Outlook. 4.4.3 Agrégateurs/lecteurs RSS Le choix du lecteur/agrégateur se fera suivant l’utilisation et la configuration mises en œuvre : • outil de veille a posteriori permettant de stocker les informations dans le client de messagerie pour analyse ultérieure • outil de veille en temps réel pour suivre les informations au fur et à mesure de leur parution. Le lecteur/agrégateur peut être intégré ou non au navigateur web. • outil collaboratif pour un partage d’informations : envoi de flux RSS par mél ou écriture d’un article sur un blog. L’outil doit alors comprendre les fonctions d’envoi et de publication. Quelques lecteurs : Lecteurs Web Bloglines Service en ligne permettant de chercher, créer et partager des flux RSS ou de s'y abonner Google Avoir un compte gmail. Interface utilisateur avec onglets Netvibes En version beta, accessible gratuitement, import des fils RSS, interface usager facilement personnalisable, comportant d'autres services Agrégateurs pour Windows, à installer Feedreader Peut se lancer automatiquement au démarrage et permet ou non l'affichage automatique des nouvelles RssReader Payant. Lit également les podcasts Windows Live avoir un compte courrier MSN ou hotmail Agrégateurs Intégrés dans un navigateur ou dans un gestionnaire de courrier Mozilla Thunderbird création d'un compte spécifique pour les fils RSS et l'archivage des fils d'information. Linux, Windows, Apple NewsGator Peut s’intégrer à Outlook Opera Linux, Windows, Apple Agrégateur multiplateforme, à installer Ippoder Permet de choisir et écouter les podcast Liste extraite de la source urfist : http://www.ext.upmc.fr/urfist/rss/agregateur.html 4.4.4 Outils de recherche des weblogs et des fils RSS Quelques moteurs de recherche et annuaires de fils RSS et blogs Moteur www.blogdimension.com/ Martine Chaussade moteur de recherche de blogs francophones 22 Recherche et veille/outils internet www.technorati.com/search 3 modes de recherche principaux : mot-clé, url et tag feedster.com/ moteur de recherche très puissant de fils RSS www.Yahoo.fr localise des sites Web et leur fil XML lorsqu'il existe ou est repérable. En outre, depuis octobre 2005 moteur de recherche de blogs en version bêta qui permet d'afficher, en plus des pages web, les résultats pertinents issus de blogs www.google.fr/blogsearch référence les blogs du monde entier, options de recherche avancée www.exalead.fr/search Permet de trier les résultats en fonction de l'existence de fils RSS Annuaires www.retronimo.com/ annuaire de flux RSS francophones et également lecteur de nouvelles www.lamooche.com/annuaire_rss.php annuaire de fils RSS et lecteur de nouvelles (grands médias, uniquement) w.moreover.com/categories/category_list_rss.h t annuaire thématique de fils RSS par catégories d'infos agrégé par la société MoreOver (une référence sur la veille informative) www.rssfeeds.com/ recherche par catégorie. www.2rss.com/ annuaire où il est possible d'ajouter ses propres sources 4.5 Listes de diffusion, forums (groupes de discussion) S’abonner à des lettres électroniques, rechercher ou participer à des forums. La veille est thématique. C’est un moyen simple, souvent gratuit, de se tenir au courant des développements dans un domaine mais également de mesurer les échanges sur un sujet. • Principes de fonctionnement : On s’abonne aux listes de diffusion (newsletter) et l’on reçoit les informations par e-mail périodiquement. Elles se situent sur des sites d’actualité et les courriers sont souvent rédigés par des experts du thème concerné. Les forums et les groupes de discussion permettent de pouvoir communiquer sur des sujets extrêmement variés. Chacun peut intervenir dans un forum de discussion par un message ou une réponse à un message. Usenet est un réseau d'ordinateurs qui s'échangent des informations (News) sur l'ensemble des newsgroups. Autre possibilité : lire les FAQ (questions les plus fréquemment posées). • Thèmes des forums de discussion L’organisation des forums (ou newsgroups) se fait par thème et le nom du groupe est généralement de type : Cat.dom.thème Catégorie générale Martine Chaussade Domaine dans la catégorie Thème d’intérêt plus pointu 23 Recherche et veille/outils internet • biz. Business comp. Informatique fr. Groupes francophones Le code ISO du pays détermine l’appartenance géographique du groupe. Recherche Elle peut se faire par des moteurs de recherche classiques. Il faut alors sélectionner l’option du moteur permettant de rechercher sur les forums (usenet ou news…). Ou avec des outils spécifiques : Annuaires des forums et listes de diffusion francophones www.francopholistes.com/ Annuaires internationaux de forums et de mailing lists lists.topica.com/dir/?cid=0 directory.dolist.net/annuaire_fr.asp Recherche de newsletters dans des n° déjà publiés de plusieurs milliers de newsletters. newsletterarchive.org Annuaire lettres d’information (décisionnel) www.pidinfo.com/ Moteur groups.google.com/ fr.groups.yahoo.com/ News 4.6 www.mailgate.org/ Le Web invisible La majeure partie du web est mal ou pas indexé par les moteurs car : • tous les formats des documents ne sont pas reconnus par les moteurs (les moteurs majeurs comme Google ou Fast reconnaissent toutefois de plus en plus de formats...). Formats référencés : HTML, PDF. Les documents multimédias (audio-vidéo, images), en constante augmentation, sont plus difficiles à indexer que les pages de texte. • de nombreux sites importants utilisent des pages «dynamiques» et non «statiques» (HTML simple), pages générées lors d'une requête par exemple • certains documents sont trop volumineux pour être entièrement indexés • des pages peuvent être protégées par l'auteur (mots de passe, balises meta qui stoppe le robot), • des pages sont invisibles car aucun lien ne pointe vers elles Martine Chaussade 24 Recherche et veille/outils internet Le "Web invisible" ("Deep Web") représente donc les informations contenues dans les fichiers et bases de données non indexables et les sites non référencés, inaccessibles aux moteurs "classiques". Exemples de sites les plus volumineux : portails scientifiques , bases de données ) sites universitaires ) sites de médias et presse en ligne ) de commerce en ligne ) sites internes de grosses sociétés )sites d'annonces, de bibliothèques en ligne... Martine Chaussade 25 Recherche et veille/outils internet L’accès au web invisible peut se présenter ainsi : OUTILS Recherche par requête COMMENTAIRES Outils spécialisés, moteurs : www.incywincy.com/ turbo10.com/ 2loq.com/ www.xrefer.com moteur britannique spécialisé (logiciel) www.thebighub.com/ Outils spécialisés, répertoires : www.completeplanet.comwww.intute.ac.uk/www.beaucoup.com/ www.findarticles.com/ www.fossick.com/Europe.htm Recherche thématiqu e Portails, serveurs organisés par thème référençant les gros sites et bases de données. Utiliser le moteur de recherche interne à chaque base pour une recherche sur le contenu. Quelques exemples : Portail ou base Adresse site Liste bases de données gratuites (J.P.Lardy, université Lyon, urfist) dadi.enssib.fr/ Liste principaux serveurs de bases de données commerciaux (J.P.Lardy, université Lyon, urfist) urfist.univ-lyon1.fr/bd-serv.html Nlsearch (Northern Light) : plusieurs millions d’articles et d’études à forte valeur ajoutée, classement résultats par thème (payant) www.nlsearch.com Dialog coporation www.dialog.com/ Dialogweb www.dialogweb.com/ Dun & Bradstreet www.dnb.com/us/ Pas de degré de pertinence des différentes bases. Mais elles peuvent être riches en information stratégique (accès payant en général), notamment pour celles des services bibliographiques et des brevets. Ces derniers font l’objet d’une validation par un dépôt légal et ou publication, puis d’un recensement. dbfrance.dnb.com/French/defau lt.htm Questel Orbit www.questel.orbit.com/fr/ Qwam www.qwam.com/ Lexis Nexis www.lexisnexis.com/ Association des professionnels de la documentation (accès à un répertoire de liens) www.adbs.fr/ The Electric Library : articles journaux, magazines, livres, emissions radio TV, photos et images (payant) www.elibrary.com/ Sites institutionnels International : utiliser +domain:gov France : .sites se terminant par gouv.fr exemple : Ministère des finances www.finances.gouv.fr Martine Chaussade 26 Recherche et veille/outils internet Ministère de la culture (bases de données) www.culture.gouv.fr/culture/bdd /index.html Signets de la Bibliothèque nationale de France (environ 1700 ressources) signets.bnf.fr/ Inist portail information scientifique et technique, sujets de thèses grandes écoles www.inist.fr/ Inria www.inria.fr/publications/index. fr.html Infothèque francophone : ressources en ligne et actulaités scientifiques francophones www.infotheque.info/ Sélection 1000 meilleurs portails d'affaires sectoriels www.objectifgrandesecoles.com/ pro/secteurs/index.htm Portail exportation www.telexport.tm.fr/ Martine Chaussade 27 Recherche et veille/outils internet 4.7 Les brevets Nom site Adresse INPI recherche gratuite des 2 dernières années de brevets www.plutarque.com/ Office européen des brevets www.european-patent-office.org/index.htm Base Patents US (20 ans de brevets américains) www.uspto.gov/patft Site d’IBM créé en mai 2000 www.delphion.com/ Organisation Mondiale de la Propriété Intellectuelle (présente la classification internationale des brevets CIB) www.wipo.int/classifications/fr/ IPR-Helpdesk – Propriété intellectuelle en Europe www.ipr-helpdesk.org/index.htm CNCPI (Compagnie nationale des conseils en propriété industrielle) www.cncpi.fr/ Les contenus des textes de demandes de brevets sont publiés, au 18ème mois de leur dépôt. Ils représentent environ 8O% de la connaissance technologique disponible et accessible : c’est donc une source d’informations très utile pour ceux qui sont capables d'en faire les analyses. Martine Chaussade 28 Recherche et veille/outils internet 5 AGENTS « INTELLIGENTS » Au delà de la recherche d’informations, ces outils permettent une automatisation de cette recherche et doivent être capables de réagir sur la base d’observations effectuées, par exemple lorsque de nouvelles informations sont publiées. Leurs principales caractéristiques sont : Une économie de temps à la fois pour le veilleur (grande quantité d’informations à traiter) et pour la visite des sites • Un balayage pertinent et le plus exhaustif possible des sources • Une détermination de manière automatique des signaux faibles. • Ces logiciels analysent le contenu des sites, trient les informations et les enregistrent sur le disque dur. Souvent une partie cliente doit être installée sur le disque pour que l’agent effectue la veille. 5.1 Technologies « Pull » et « Push » La technologie la plus couramment utilisée sur le Web est appelée « Pull », car l’utilisateur doit aller chercher les informations. La technologie « Push » consiste à délivrer de manière automatique des informations disponibles, en fonction des critères de sélection retenus par l’utilisateur. 5.2 Agents d’alerte • Principes et avantages : Ils signalent les modifications intervenues sur une ou plusieurs Url(s) précédemment identifiée(s) par envoi d’un courrier électronique (agent Pull). Ces agents effectuent automatiquement la collecte de données. Certains outils sont faciles à utiliser mais leurs activités de veille restent limitées. • Quelques agents Editeur Produit Site web Prix ChangeDetect ChangeDetect www.changedetect.com/ Copernic Copernic Tracker www.copernic.com/fr/ 49,95€ Surveille de changements de mots, images… alerte par courriel, sur le bureau ou sur téléphone portable. Autres fonctonnalités disponibles. 30j essai gratuit Digimind Digimind Monitor www.digimind.fr/monito r.htm Payant Intègre la surveillance de sites web complets grâce à un crawler capable de tracer l'arborescence d'un site avant de le placer en veille. Google Martine Chaussade www.google.com/alerts? gratuit Commentaires Surveille et alerte de changements dans un site web. Gratuit alerte par courriel dès qu'un mot clé 29 Recherche et veille/outils internet choisi est présent dans une dépêche d'actualité du site Google News, ou lorsqu'un nouveau lien apparaît dans la liste des résultats du moteur de recherche. Mots-clés en anglais, français, italien, allemand, espagnol et chinois (max. 50 alertes) hl=fr Peacefire TracerLock www.tracerlock.com/ Website Watcher Website Watcher aignes.com/ Sénat 5.3 4$/mois Standard 19,5$/m Premium Surveillance et d'alerte de changements de contenu en fonction de mots-clés, alerte par e-mail. Surveillance possible de groupes Usenet Nouveau service de surveillance sur les centaines de sources d'actualité en ligne (alerte possible toutes les 15 mn) gratuit 30jours Fusion avec The Informant (rachat) 29,95€ 49,95€ 99,00€ 1990,00€ Basic Edition Personal Edition Business Edition Business Edition – site Licence surveille et alerte des changements de contenu. Le suivi de chaque site peut être personnalisé. Nombreuses autres fonctionnalités. gratuit Nouveau service de veille parlementaire par courriel (6/3/2006) www.senat.fr Agents technologie push automatisée Ils assurent la collecte et le prétraitement des données. Envoi automatique d'informations (page Web ou E-mail) selon des critères sélectionnées par l'utilisateur. : il définit son profil. • Quelques agents Nom Connection Prix Commentaires fr.my.yahoo.com/ on line gratuit L’utilisateur choisit les rubriques qui l’intéressent et peut ensuite les consulter (actualité, météo, prix des actions, résultats sportifs et ressources web) www.net2one.fr e-mail Gratuit Net2one Référence des milliers de et Plusieurs sources d'informations. Permet de forfaits déterminer un profil et de surveiller ainsi les sujets de son choix (payant suivant le nombre de mots clés). www.newspage.com/ e-mail Gratuit Inscription gratuite à une page web d’information dans laquelle on choisit son profil (my newspage). www.watznew.com/ e-mail 24,95€ Permet de construire un portail d'information personnalisé sur Internet Martine Chaussade 30 Recherche et veille/outils internet On-line www.wikio.fr 5.4 gratuit Moteur de recherche d’actualités (médias et blogs). L’utilisateur crée un profil de pages à surveiller par la saisie de mots-clés (un profil par onglet). S’inscrire sur le site afin de sauvegarder cette page personnalisée, elle est alors accessible depuis n’importe quel poste connecté à Internet Aspirateurs de site • Principes et avantages : Logiciels qui se connectent automatiquement sur un site et en "aspirent" les pages. Ils effectuent une recopie du site sélectionné sur le disque dur et permettent une lecture "offline" par la suite. Un des avantages est de pouvoir programmer la récupération de tout ou partie de sites à des heures de moindre trafic et de consulter certaines pages en détail sans être vu de l’extérieur. De nombreuses possibilités de paramétrage existent : profondeur des liens à explorer, limitations en taille/nombre de fichiers, définition du type de documents à rapatrier ou à exclure. • Principaux logiciels disponibles Editeur Produit Site web Blue Squirrel WebWhacker 2000 www.bluesquirrel.com / Goto Software MemoWeb 4 www.goto.fr Prix Commentaires 49,95$ Version évaluation gratuite 25,00 € Découverte MemoWeb 4 Wysigot Wysigot (Ecatch) www.wysigot.com/ Gratuit 31,77 € Fonctions avancées www.ecatch.com Maxim Klimov WebCopier www.maximumsoft.co m 30$ MetaProducts Offline Explorer Offline Explorer Pro www.metaproducts.co m 30$ Version évaluation gratuite 70$ SoftByte Labs BlackWidow www.softbytelabs.co m 39,95$ Version évaluation gratuite Spidersoft WebZIP standard WebZIP unlimited www.spidersoft.com 39,95$ Version évaluation gratuite. 59,95$ SurfWare Aaron’sWebVacuum surfware.bizland.com 29,95$ Téléchargement de fichiers à partir de sites. Version évaluation gratuite Martine Chaussade 31 Recherche et veille/outils internet Tennyson Maxwell 5.5 Teleport Pro 39,95$ Version évaluation gratuite www.tenmax.com Solutions de veille Quelques solutions Editeur Aignes Produit WebSite-Watcher Site web www.aignes.com/features.htm Commentaires Contrôle si des mises à jour ont été faites sur plus de 100 sites par minute et télécharge les modifications sur le disque dur. Mise en évidence des changements automatiques. Alertes par courriel ou ouvre le site concerné si mise à jour détectée. De 29,95 € à 1 990 € Arisem Kaliwatch Pro Kaliwatch Server www.arisem.com/fr/produits/i Surveillance du Web en continu, classification de ndex.html l'information selon des catégories prédéfinies et sous forme d'arborescence, diffusion de l'information en mode alerte. Kaliwatch Server propose, en outre, de multiples fonctionnalités de travail coopératif. BEA Conseil KB Crawl www.beaconseil.com/site/main Surveillance de toutes les sources identifiées. .php3?id_rubrique=199&fkpar Alertes sélectives par courriel lors de changement ent=6 de contenu, apparition de mots-clés ou de nouvelle page. Difusion de rapports de veille. Archivage des documents trouvés. Copernic Copernic Agent Professional www.copernic.com/ Copernic Tracker Copernic Summerize Accès à plus de 1 000 moteurs de recherche répartis en 120 catégories. Surveillance des contenus d'un nombre illimité de pages Web. Résumés des pages Web trouvées et extraction de leurs concepts clés. Alertes par courriel avec copie de la page où les changements sont surlignés. Prix suite 3 produits : 119,95 € Intelliseek Marketing intelligence intelliseek.com/solutionsbybiz .asp Propose une gamme de solutions répondant à des besoins marketing. Une autre gamme de produits s'adresse à des besoins industriels. Sinequa Intuition Corporate Edition www.sinequa.com/html-fr/frproduit.ice.html Le moteur de recherche Intuition l'ensemble des sources d'information internes et externes à l'entreprise et orffre une interface personnalisée de recherce et de navigation. www.autonomy.com/content/P roducts/IDOL_K2/ Verity rachetée par Autonomy. Solution intégrée de recherche et de catégorisation, IDOL K2 indexe de multiples sources de données textuelles (courriels, bases de données, sites Web) et référence automatiquement les nouveaux documents. La solution fusionne et catégorise les résultats issus de recherches sur les index de sources d'information Internet. Autonomy/Verit IDOL K2 y Martine Chaussade 32 Recherche et veille/outils internet Digimind Digimind Evolution www.digimind.fr/ Solution intégrée composée d'une plate-forme de base sur laquelle viennent se greffer des modules additionnels. La surveillance de pages ou de sites Web est possible, ainsi que des alertes par courriel en fonction d'un niveau de modification prédéterminé.Le Web invisible, les listes de discussion et les groupes de discussion Usenet sont également surveillables. Plate-forme complète qui s’adresse plutôt aux grands groupes Martine Chaussade 33 Recherche et veille/outils internet 6 AUTOMATISATION DE LA VEILLE 6.1 Collecte automatique des données Après l’audit des besoins, définir les actions suivantes : Actions Types de documents et de pages web à surveiller créer une base de connaissances Outils Annuaire (en phase initiale uniquement) Moteur, méta-moteur Aspirateur Fréquence de surveillance Agent d’alerte Domaines d’actualités à suivre Blog, médias, forum, liste de diffusion, FAQ, autres sites spécialisés Repérage de nouveaux sites Placer des alertes sur des listes de liens qualifiés (signets) Interroger des sites spécialisés sur les nouveautés, actualités Abonnement à des services de veille sur profil Outils de push automatisé, courrier électronique. Filtration automatique des messages électroniques 6.2 Définition de règles de gestion des messages électroniques dans le logiciel de messagerie. Traitement automatique Les outils logiciels permettent d’avoir une vision globale des documents recueillis. Les mots clés, concepts sont utilisés à l’aide de méthodes de calcul pour afficher des cartographies plus ou moins sophistiquées. Autres traitements : la définition et le croisement de variables pour découvrir des éléments d’évolution stratégique 6.3 Diffusion sélective des informations Les outils logiciels « push » permettent de diffuser automatiquement et de façon personnalisée les données issues des différentes analyses ou autres informations. Les solutions/plate-formes de veille intègrent généralement des outils de diffusion sélective. Aujourd’hui, le format RSS est très largement adopté comme outil push. Martine Chaussade 34 Recherche et veille/outils internet 7 ORGANISMES DE SERVICES DE VEILLE 7.1 Infomédiaires Nouveau métier du Web qui a pour activité l’agrégation de contenus (produits par d’autres) pour une rediffusion vers le grand public ou les entreprises. De façon générale, cet intermédiaire rassemble des informations sur les consommateurs (quelquefois contre rémunération) pour les revendre, mais aussi sélectionne des produits et services susceptibles de convenir à ces mêmes consommateurs. 7.2 Experts • Fonctionnement Les sites experts recouvrent tous les domaines : santé, droit, finance, nouvelles technologies… Les sociétés se sont orientées vers des solutions globales de gestion des connaissances. Les sites professionnels sont des services de veille. • Quelques sites International Sites professionnels 7.3 Askme www.askme.com Webhelp www.webhelp.com Cybion www.cybion.fr Veille www.veille.com Clubs de veille Des clubs de veille sectoriels existent souvent dans les régions (voir les CCI). Atelier BNP-Paribas Cellule de veille générique du groupe. www.atelier.fr/. Lieu de veille depuis plus de 20 ans, l’atelier offre un ensemble de prestations. 7.4 Associations Les SCIP Association de professionnels créée en 1992 en France : SCIP France (association pour la promotion de l’intelligence économique et concurrentielle) sur le même modèle que celle des USA (1986), mais sont indépendantes. D’autres organisations similaires existent dans le monde http://www.scipfrance.org AFDIE Martine Chaussade 35 Recherche et veille/outils internet Association française pour le développement de l’Intelligence Economique AFDIE www.afdie.net/ FING La Fing est une association qui a pour vocation de repérer, stimuler et valoriser l'innovation dans les services et les usages des TIC. http://www.fing.org/ Depuis fin avril 2004 la FNIG a mis en ligne un service coopératif de veille et de publication www.vcoop.net. Martine Chaussade 36 Recherche et veille/outils internet 8 LIENS UTILES www.abondance.com/ ou www.abondance.net/ ou www.abondance.fr/ Recherche d’informations, référencement…, site d’Olivier Andrieu www.adit.fr/ Agence pour la diffusion de l’Information technologique www.afdie.net/ Association française pour le développement de l’Intelligence Economique www.anvar.fr/ Agence française de l’Innovation www.cybion.fr Recherche d'informations et veille sur Internet www.ubifrance.fr/ Agence française pour le développement des entreprises www.enfin.com recense un grand nombre de moteurs spécialisés www.goov.org Portail du service public Adminet et moteur de recherche Auracom proposent un suivi d’informations des sites institutionnels français. www.ie-news.com/ Portail d’informations coonsacré à L’intelligence économique www.intelligence-center.com/ ou http://c.asselin.free.fr/ Site de recherche d’informations, d’inteliigence économique on-line et de veille sur le net www.intelligenceonline.fr/ Système d'intelligence politique et économique www.intelligence-economique.gouv.fr/ Site du gouvernement www.lapasserelle.com/sm/formation_veille.html#rang 1 Liste d’outils de recherche et de veille sur internet www.plan.gouv.fr/ Commissariat général au Plan : publie des documents consacrés à l’Intelligence Stratégique searchenginewatch.com/ Tout sur les moteurs de recherche : actualité, comparatifs, fiches descriptives… www.strategic-road.com Répertoire thématique de sites Internet sur la veille stratégique www.touteleurope.fr/francais/ Nouveau portail sur l'Europe qui agrège un ensemble d'informations issues de sources hétérogènes (Blogs, sites officiels du gouvernement, etc) dadi.enssib.fr/ Liste bases de données gratuites (J.P.Lardy, université Lyon, urfist) www.veille.com Présente l'ouvrage de Carlo Revelli l'Intelligence stratégique sur Internet veille.co.uk/ Annuaire de la veille Martine Chaussade 37