Inist - medial

Transcription

Inist - medial
L'Institut de l'Information
Scientifique et Technique
Unité Propre de Service 076
du CNRS
Une définition de l’IST
L’IST = matière première de la recherche
« (…) l’ensemble des connaissances générées par les
activités des groupes de recherche et qui, après
validation par la communauté internationale, (validations
par les pairs) est transformée et exploitée selon les
besoins de différents publics. »
Extrait du PLF 2006, rapport annexe sur l’état de la recherche et du développement
technologique.
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
2
Les composantes de l’IST
Publications
Revues, thèses, actes
de congrès, ouvrages,
brevets
Données factuelles et
de recherche
Données d’expérience, molécules,
séquences de protéines, images,
enregistrements vidéos
ou sonores…
Référencement
- bases de données
bibliographiques, catalographiques
et factuelles
- moteurs de recherche
généralistes & spécialisés
Analyse et exploration
Bibliométrie, infométrie, statistiques,
cartographies, indicateurs, data mining
etc.
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
3
Une composante essentielle
de l’IST
Revues scientifiques = 1er vecteur de diffusion
des résultats de la recherche.
Revues scientifiques = principal outil
d’évaluation des chercheurs (*).
(*) essentiellement à travers le Journal Citation
Reports de Thomson ISI qui fournit le Facteur
d’Impact (FI) de près de 7000 titres
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
4
L'INIST-CNRS au cœur du
dispositif de traitement de l’IST
Collecte / acquisition
(revues scientifiques actes de
congrès, thèses, rapports, …)
Traitements
(catalogage, numérisation, mutualisation
des ressources électroniques, veille
thématique et sectorielles, production
éditoriale,…)
Signalement / diffusion / valorisation
(bases de données bibliographiques, portails
documentaires, études et dossiers de synthèse
scientifique, fourniture de documents à la demande,
édition électronique …)
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
5
La numérisation à l’Inist-cnrs
Depuis 1990 : numérisation en mode image à priori des
revues les plus demandées en fourniture de documents, puis
de tout le fonds : 7 millions d’articles
Depuis 2000 : numérisation en mode image à la demande
pour la fourniture électronique de documents : 250 000
articles
Depuis 2003 : numérisation en mode texte pour la diffusion
d’archives numériques de publications scientifiques (activité
d’édition électronique)
Numérisation ponctuelle en mode image d’archives
d’éditeurs
Depuis 2004, un service puis un département d’édition
numérique de 10 personnes en liaison permanente avec 1
informaticien et 1 technicien de l’atelier de numérisation,
renforcés par d’autres collègues selon les projets
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
6
La numérisation à l’Inist-cnrs
Quelques chiffres
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
7
Les services d’édition
électronique à INIST-CNRS
Des services complémentaires
à l'échelle internationale
I-Revues (http://irevues.inist.fr)
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
9
I-Revues (http://irevues.inist.fr)
Mise en ligne de revues, actes de congrès, livres
électroniques, fonds documentaire et lettres d’information de
tous domaines scientifiques (courant et rétrospectif)
Modèle économique selon le souhait de l’éditeur
Apport de valeur(s) ajoutée(s) par liaison avec les autres
produits et services de l'INIST
Indexation, référencement, diffusion
2 Solutions technologies des interfaces issues du “libre”
dont
DSpace (www.dspace.org) : plateforme de dépôt, d’archivage
et de diffusion ; environnement pérenne XML (DublinCore, xsl)
et interopérable (OAI-Pmh) ; personnalisation de l’interface par
éditeur
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
10
I-Revues – en constante évolution
26 000 documents
Chiffres mai 2010
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
11
LARA (http://lara.inist.fr)
L’engagement du CNRS et de l’INIST dans le
mouvement du Libre Accès
Un fonds unique « papier » de 70 000 rapports
scientifiques et techniques
La volonté d’accroître la visibilité et
l’accessibilité des rapports gris
Plus de 1 000 documents disponibles en
version électronique
Des fonctionnalités identiques à I-Revues
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
12
Quelques exemples de
publications « patrimoniales »
Le journal de physique : 1872-1990
Sous-traitance pour EDPSciences
Plus de 40 000 pages pour 15 000 articles
Traitement des références bibliographiques de fin d’articles
La revue forestière française : 19493 lots : 1949-1968, 1969-1996, 1996 à nos jours
3 prestataires de numérisation différents
La mémoire du XXe siècle sur la prospective, l’innovation et des
territoires(CNAM Lorraine) : 1950 – 2000
Bulletin de l’académie lorraine des sciences : 1873Objectif patrimonial territorial
8 200 pages issus de fonds documentaires massicotables et non
Génération de métadonnées suivi la typologie du contenu
Projet de valorisation du patrimoine scientifique lorrain (DRAC)
80 publications recensées ; 24 revues dans Gallica
Projet sur 3 ans
Documents de format pdf « texte caché »
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
13
La méthodologie
Specifications de la publication (fiche Excel)
Antériorité
Disponibilité du fonds documentaire (massicotable ou
non)
Spécification physique des documents à numériser
(format, double-page, planche, n&b ou couleur,
présence d’illustrations, etc.)
Disponibilité de documents pdf récents
Disponibilité de sommaire / notice catalographique
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
14
La méthodologie (2)
Préparation de la collection à traiter
Tests avec différentes résolutions en fonction des
contenus
Préparation des sommaires si besoin pour production
des documents pdf correspondants
Spécifications pour le nommage des fichiers en
corrélation avec les notices catalographiques
associées
Massicotage des documents
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
15
La méthodologie (3)
Numérisation
Production de fichiers images (.tif)
Corrections des images (cadrage, courbure, points,
uniformisation des pages, etc.)
Sélection et export des images, retouche, optimisation du
poids, etc…
Océrisation des zones textuelles (contrôle selon
spécification choisie avec l’éditeur
Finalisation et édition du document pdf
Contrôle qualité
Traitement spécifiques des fichiers représentants les
couvertures des numéros « papier »
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
16
Le processus de numérisation
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
17
La méthodologie (4)
Préparation des notices catalographiques
associées (format XML DublinCore)
Fournies par éditeur (fichiers excel, word, XML) :
reformatage
Extraites du système d’information de l’Inist-cnrs
Produites spécialement pour le projet
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
18
La méthodologie (5)
La diffusion
Association des fichiers pdf et xml
Chargement dans l’interface
Génération automatique des sommaires
Personnalisation de l’interface
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
19
Un gamme de matériel complète pour
tout type de document
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
20
Logiciels
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
21
Traitement de l’image
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
22
Les bilans
A chaque étape ses contraintes
Dépend des données fournies
Gestion des plannings / ressources humaines
Espace de travail (serveurs) suffisamment conséquent
Travail de qualité reconnu
Évolution de la chaine au fur et à mesure des projets
Vers l’optimisation des traitements
Journée MEDIAL - Numérisation Inist/cnrs - 7 juin 2010
23
Merci pour votre attention
[email protected]
[email protected]
[email protected]