Télécharger un résumé des interventions

Transcription

Télécharger un résumé des interventions
Journée d'étude
« Signalement et numérisation des incunables »
Centre d'études supérieures de la Renaissance, Tours
18 novembre 2010
Réunion technique : « Signalement des incunables : catalogage partagé, coopération et
interopérabilité »
Les deux grands projets de catalogues collectifs d'incunables en ligne
• John Goldfinch (British Library) : le modèle de travail de l'ISTC (format des données,
catalogage et signalement collaboratifs)
Derrière l'ISTC on retrouve l'histoire de la description courte des incunables, qui a commencé avec les
informations simples données dans le catalogue de Hain, mais paradoxalement également l'histoire de la
description longue. La naissance de l'ISTC est en effet intervenue suite aux lenteurs subies par le
Gesamtkatalog der Wiegendrucke, une entreprise de description très détaillée des incunables (normalisation
des entrées auteur, titre, adresse typographique, références à d'autres catalogues, étude des caractères
typographiques, etc.). Les délais de parution du GW ont conduit aux États-Unis à la rédaction du catalogue
de Goff (1964), qui a ensuite été converti en Marc par la British Library (1980), selon le modèle utilisé pour
le Eighteenth-Century Short Title Catalogue. Les technologies informatiques sur lesquelles est basé l'ISTC
ont ensuite été mises à jour : adoption du schéma MarcXML, l'Université de Liverpool fournissant
l'infrastructure (hébergement, moteur de recherche). Le catalogage se fait via un éditeur XML légèrement
adapté grâce à une feuille de style.
Les travaux récents de l'ISTC ont été marqués par des collaborations multiples avec des
bibliothèques étrangères afin de localiser les exemplaires conservés par ces bibliothèques (et éventuellement
leur numérisation) dans l'ISTC, mais aussi, en sens inverse, afin que les informations contenues dans l'ISTC
puissent être réutilisées dans des projets collaboratifs (projet Inka à Tübingen, recensement des incunables
conservés en Suède, recensement des incunables conservés en Autriche, etc.) ou par des établissements en
particulier. Les notices bibliographiques ont ainsi pu être enrichies localement, en particulier avec les
données d'exemplaires, avant d'être reversées dans l'ISTC.
• Werner Klarkowski (Staatsbibliothek zu Berlin) : l'infrastructure du catalogue du
Gesamtkatalog der Wiegendrucke (GW)
Le Gesamtkatalog der Wiegendrucke a eu dès le départ l'ambition de fournir une description bibliographique
suffisamment fine pour donner la garantie presque complète de l'identification exacte d'une édition. 11
volumes ont été publiés et 3 sont presque prêts pour publication. L'équipe estime qu'elle a couvert environ
52% des descriptions intégrales d'éditions. Les données statistiques du GW montrent que le nombre
d'exemplaires d'incunables conservés dans le monde est estimé à environ 300.000.
L'infrastructure du GW est assez complexe : une base Oracle en XML sert de support à une interface
de catalogage, une interface de pré-publication (pour la future publication imprimée du catalogue) et une
interface de publication web. Il n'existe pas d'export/exposition automatique des données, mais une solution
serait un export de métadonnées TEI P5 via un protocole OAI. En effet, le GW utilise jusqu'à présent ses
propres schémas XML, mais pourrait évoluer vers l'utilisation de la TEI P5. L'interrogation du catalogue se
fait grâce au langage Xquery, par 11 critères de recherche ; il existe également une recherche géographique.
Enfin, le GW est riche de plus de 15000 liens internes, ainsi que de liens externes vers l'ISTC et vers des
exemplaires numérisés.
Qualité et organisation des données d'édition et d'exemplaires
• Bettina Wagner (BSB) : le modèle de catalogage des incunables à la Bayerische
Staatsbibliothek
La Bibliothèque de l’État de Bavière est riche de plus de 9700 éditions et 20000 exemplaires d'incunables.
La quasi totalité des éditions est décrite dans le catalogue imprimé. Récemment, le catalogage a été
fortement lié à la politique de numérisation : il a été décidé de numériser un exemplaire de chaque édition
sauf si cette édition avait déjà été numérisée dans un autre établissement. Le cataogue BSB-Ink est en ligne
depuis 2004, et est le résultat de la conversion du catalogue imprimé. Il s'agit d'une base Access qui permet
de générer une sortie XML basée sur le schéma utilisé par le GW (et proche de la TEI). Cette base de
données comporte une table pour la description des éditions, une pour la description des exemplaires, et une
pour les informations internes. Le catalogage se fait donc au travers d'un formulaire Access.
Le catalogue a été versé manuellement dans le Catalogue collectif de la Bavière pour une visibilité
plus importante au niveau de l’État et au niveau européen. Les notices présentes dans ce catalogue collectif
sont plus succinctes (et par ailleurs, il existe des différences dans le traitement des accès contrôlés) mais
elles ont l'avantage de pouvoir être récupérées dans l'OPAC de la BSB. C'est cette notice courte de l'OPAC
qui est utilisée pour les métadonnées descriptives de la bibliothèque numérique. Enfin l'ISTC et le GW en
ligne renvoient vers les exemplaires numérisés de la BSB lorsqu'ils existent.
• Cristina Dondi (CERL) : Material evidence in incunabula : une base de données de
descriptions d'exemplaires d'incunables non encore décrits en détail dans les catalogues
A la demande du CERL, l'Université de Gottingen a développé l'application "Material evidence in
incunabula", qui est destinée à recevoir des informations issues des données d'exemplaires des incunables,
afin de servir de matériau historique. De nombreux catalogues d'incunables existent en effet, mais il manque
une base de partage des données de provenance, de reliure, etc.
Les données bibliographiques ont été extraites de l'ISTC. L'ajout de données d'exemplaires permet,
par exemple, en croisant plusieurs critères, de trouver les éditions vénitiennes en usage à Paris au XVIIe
siècle. Les blocs de provenance sont affichés par ordre chronologique, avec des informations riches et des
liens vers le thésaurus du CERL pour les noms de personnes et lieux d'édition. Les informations présentes
sont qualifiées : sexe de l'ancien possesseur, statut laïc ou religieux, aristocrate ou membre d'une profession
(avocat, médecin,...), mode d'acquisition de l'ouvrage, type de preuve (reliure, décoration), source (livre en
main, catalogue...).
Ces données sont basées sur une structure Unimarc. Il est donc possible de les entrer dans un OPAC.
Certains champs sont du texte libre, d'autres des cases à cocher. Pour l'instant, il n'existe qu'une centaine de
notices. Le choix de l'Unimarc a été fait afin d'être facilement interopérable avec le Thésaurus du CERL et la
base HPB. L'accès à l'interface de saisie se fait par authentification. On pourrait donc imaginer l'ouvrir plus
largement aux chercheurs en histoire du livre. Il serait intéressant, par ailleurs, de partager les champs
Unimarc spécifiquement créés pour le projet.
La situation en France
• Lætitia Bontemps (CESR) et Florent Palluault (MCC/DGMIC/SLL) : Rétroconversion des
Catalogues régionaux des incunables : projet, méthode, format.
Les Catalogues régionaux des incunables ont été publiés à partir de 1979 sous la responsabilité du Ministère
de la Culture et de la Communication. 15 volumes ont été publiés jusqu'à présent, et environ 15 autres
doivent voir le jour avant l'achèvement du projet. Le MCC a délégué la coordination de la publication et
l'expertise scientifique au Centre d'études supérieures de la Renaissance. Le financement du MCC couvre les
coûts de publication et la coordination scientifique. Le catalogage, en revanche, ne fait pas l'objet d'un
subventionnement, ce qui explique les délais de plus en plus longs de rédaction des ouvrages, alors que les
notices descriptives ont au contraire tendance à se complexifier.
Le MCC a demandé au CESR une étude de faisabilité pour rétroconvertir les volumes des CRI déjà
publiés, et pour prévoir également un catalogage informatisé des prochains volumes. Le CESR s'est chargé
d'obtenir les précédents volumes au format électronique, soit par numérisation et océrisation, soit par
récupération du fichier ayant servi à la publication. Un groupe de travail inter-établissements a été créé pour
décider du format le plus adapté pour cette informatisation. Diverses solutions ont été étudiées : format
propre, EAD, Unimarc, TEI. L'objectif était d'être le plus proche possible des notices tout en favorisant
l'interopérabilité avec les autres grands catalogues (ISTC, GW, et potentiellement le CIBN). Le choix s'est
finalement porté sur une combinaison de MARC et de TEI : cette solution permet de tirer parti du langage
XML (et de l'encodage des caractères en Unicode), de la structuration MARC (idéale pour les documents
imprimés et fournissant une compatibilité avec les notices descriptives de post-incunables) et de la
sémantique TEI (pour les transcriptions de texte, la mise en forme et les données spécifiques d'exemplaires).
Pour la mise en œuvre, il conviendra de repérer les différentes notices descriptives d'une même
édition publiées dans différents volumes et d'en dériver une "notice canonique" qui reprenne les données les
plus complètes, les plus précises et les plus à jour. On étudie la possibilité d'avoir recours à des données
extérieures, en particulier à celles de l'ISTC, qui permettraient de rassembler aisément les différentes notices
d'une même édition présentes dans différents volumes des CRI. Une fois la rétroconversion terminée, on
passerait d'une structuration régionale à un catalogue national, dans lequel il serait possible à terme d'ajouter
les données rétroconverties du CIBN.
Le projet en est encore à ses débuts. De nombreuses questions restent encore en suspens en
ce qui concerne le calendrier, le financement, l'appel ou non à un prestataire de rétroconversion,
l'implication de la BnF (CIBN) et de partenaires extérieurs, ou encore la création d'un module de
catalogage (en XML ou non).
• Martine Lefèvre (BnF) : Le Catalogue des Incunables de la Bibliothèque nationale de
France : état actuel du catalogue, modèle de catalogage.
Le Catalogue des incunables de la Bibliothèque nationale a débuté en 1971. La première publication a eu
lieu 10 ans plus tard. Il reste à publier les volumes correspondant aux lettres E-F (dont la rédaction est
terminée), ainsi que celui correspondant à la lettre G (en cours de rédaction). La publication serait donc
achevée en 2013, à l'exception des tables, addenda et corrigenda. Le catalogage du CIBN se fait actuellement
sous Word. L'ensemble existe d'ailleurs sous forme électronique, mais cette version électronique n'est pour
l'instant qu'à usage interne (et pour l'éditeur). Au fur et à mesure de la publication, le catalogage est devenu
de plus en plus précis, avec une attention particulière donnée aux éditions françaises. Des notices
informatisées plus brèves sont aussi présentes dans le Catalogue général : ces notices issues de la
rétroconversion du Catalogue des imprimés, continuent à être enrichies (liens aux autorités noms de
personnes, etc.).
On estime que la Réserve des Livres rares de la BnF conserve 10000 volumes correspondant à 8000
éditions. Il reste à décrire les collections de la bibliothèque de l'Arsenal et celles du département des Arts du
Spectacle. Le catalogage des 1500 exemplaires de l'Arsenal a commencé en 2002. La publication est prévue
pour 2017 (500 exemplaires ont été décrits jusqu'à présent).