Inist - medial
Transcription
Inist - medial
L'Institut de l'Information Scientifique et Technique Unité Propre de Service 076 du CNRS Une définition de l’IST L’IST = matière première de la recherche « (…) l’ensemble des connaissances générées par les activités des groupes de recherche et qui, après validation par la communauté internationale, (validations par les pairs) est transformée et exploitée selon les besoins de différents publics. » Extrait du PLF 2006, rapport annexe sur l’état de la recherche et du développement technologique. Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 2 Les composantes de l’IST Publications Revues, thèses, actes de congrès, ouvrages, brevets Données factuelles et de recherche Données d’expérience, molécules, séquences de protéines, images, enregistrements vidéos ou sonores… Référencement - bases de données bibliographiques, catalographiques et factuelles - moteurs de recherche généralistes & spécialisés Analyse et exploration Bibliométrie, infométrie, statistiques, cartographies, indicateurs, data mining etc. Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 3 Une composante essentielle de l’IST Revues scientifiques = 1er vecteur de diffusion des résultats de la recherche. Revues scientifiques = principal outil d’évaluation des chercheurs (*). (*) essentiellement à travers le Journal Citation Reports de Thomson ISI qui fournit le Facteur d’Impact (FI) de près de 7000 titres Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 4 L'INIST-CNRS au cœur du dispositif de traitement de l’IST Collecte / acquisition (revues scientifiques actes de congrès, thèses, rapports, …) Traitements (catalogage, numérisation, mutualisation des ressources électroniques, veille thématique et sectorielles, production éditoriale,…) Signalement / diffusion / valorisation (bases de données bibliographiques, portails documentaires, études et dossiers de synthèse scientifique, fourniture de documents à la demande, édition électronique …) Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 5 La numérisation à l’Inist-cnrs Depuis 1990 : numérisation en mode image à priori des revues les plus demandées en fourniture de documents, puis de tout le fonds : 7 millions d’articles Depuis 2000 : numérisation en mode image à la demande pour la fourniture électronique de documents : 250 000 articles Depuis 2003 : numérisation en mode texte pour la diffusion d’archives numériques de publications scientifiques (activité d’édition électronique) Numérisation ponctuelle en mode image d’archives d’éditeurs Depuis 2004, un service puis un département d’édition numérique de 10 personnes en liaison permanente avec 1 informaticien et 1 technicien de l’atelier de numérisation, renforcés par d’autres collègues selon les projets Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 6 La numérisation à l’Inist-cnrs Quelques chiffres Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 7 Les services d’édition électronique à INIST-CNRS Des services complémentaires à l'échelle internationale I-Revues (http://irevues.inist.fr) Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 9 I-Revues (http://irevues.inist.fr) Mise en ligne de revues, actes de congrès, livres électroniques, fonds documentaire et lettres d’information de tous domaines scientifiques (courant et rétrospectif) Modèle économique selon le souhait de l’éditeur Apport de valeur(s) ajoutée(s) par liaison avec les autres produits et services de l'INIST Indexation, référencement, diffusion 2 Solutions technologies des interfaces issues du “libre” dont DSpace (www.dspace.org) : plateforme de dépôt, d’archivage et de diffusion ; environnement pérenne XML (DublinCore, xsl) et interopérable (OAI-Pmh) ; personnalisation de l’interface par éditeur Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 10 I-Revues – en constante évolution 26 000 documents Chiffres mai 2010 Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 11 LARA (http://lara.inist.fr) L’engagement du CNRS et de l’INIST dans le mouvement du Libre Accès Un fonds unique « papier » de 70 000 rapports scientifiques et techniques La volonté d’accroître la visibilité et l’accessibilité des rapports gris Plus de 1 000 documents disponibles en version électronique Des fonctionnalités identiques à I-Revues Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 12 Quelques exemples de publications « patrimoniales » Le journal de physique : 1872-1990 Sous-traitance pour EDPSciences Plus de 40 000 pages pour 15 000 articles Traitement des références bibliographiques de fin d’articles La revue forestière française : 19493 lots : 1949-1968, 1969-1996, 1996 à nos jours 3 prestataires de numérisation différents La mémoire du XXe siècle sur la prospective, l’innovation et des territoires(CNAM Lorraine) : 1950 – 2000 Bulletin de l’académie lorraine des sciences : 1873Objectif patrimonial territorial 8 200 pages issus de fonds documentaires massicotables et non Génération de métadonnées suivi la typologie du contenu Projet de valorisation du patrimoine scientifique lorrain (DRAC) 80 publications recensées ; 24 revues dans Gallica Projet sur 3 ans Documents de format pdf « texte caché » Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 13 La méthodologie Specifications de la publication (fiche Excel) Antériorité Disponibilité du fonds documentaire (massicotable ou non) Spécification physique des documents à numériser (format, double-page, planche, n&b ou couleur, présence d’illustrations, etc.) Disponibilité de documents pdf récents Disponibilité de sommaire / notice catalographique Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 14 La méthodologie (2) Préparation de la collection à traiter Tests avec différentes résolutions en fonction des contenus Préparation des sommaires si besoin pour production des documents pdf correspondants Spécifications pour le nommage des fichiers en corrélation avec les notices catalographiques associées Massicotage des documents Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 15 La méthodologie (3) Numérisation Production de fichiers images (.tif) Corrections des images (cadrage, courbure, points, uniformisation des pages, etc.) Sélection et export des images, retouche, optimisation du poids, etc… Océrisation des zones textuelles (contrôle selon spécification choisie avec l’éditeur Finalisation et édition du document pdf Contrôle qualité Traitement spécifiques des fichiers représentants les couvertures des numéros « papier » Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 16 Le processus de numérisation Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 17 La méthodologie (4) Préparation des notices catalographiques associées (format XML DublinCore) Fournies par éditeur (fichiers excel, word, XML) : reformatage Extraites du système d’information de l’Inist-cnrs Produites spécialement pour le projet Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 18 La méthodologie (5) La diffusion Association des fichiers pdf et xml Chargement dans l’interface Génération automatique des sommaires Personnalisation de l’interface Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 19 Un gamme de matériel complète pour tout type de document Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 20 Logiciels Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 21 Traitement de l’image Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 22 Les bilans A chaque étape ses contraintes Dépend des données fournies Gestion des plannings / ressources humaines Espace de travail (serveurs) suffisamment conséquent Travail de qualité reconnu Évolution de la chaine au fur et à mesure des projets Vers l’optimisation des traitements Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010 23 Merci pour votre attention [email protected] [email protected] [email protected]