Glossaire e
Transcription
Glossaire e
Département fédéral de l'intérieur DFI Office fédéral de la culture OFC Bibliothèque nationale suisse BN Glossaire e-Helvetica Version: Version 1.3 Date: 05.02.2016 Table des matières Access Administration Archivage à long terme Archival Storage Backup incrémentiel Bases de données Cache Data Management Disponibilité à long terme DOI (Digital Object Identifier) Domain e-Helvetica e-Helvetica Access e-Helvetica Deposit E-mail Emulation Format de fichier Format propriétaire FTP (File Transfer Protocol) Harvesting Helvetica Helveticat Homepage HTTP (Hypertext Transfer Protocol) Hyperlien Ingest Internet Intranet JDBC (Java Database Connectivity) MARC Métadonnées METS (Metadata Encoding & Transmission Standard) Migration MODS (Metadata Object Description Schema) NAS (Network Attached Storage) NFS (Network File System) Ninive Numérisation OAI (Open Archives Initiative) OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) OAIS (Open Archival Information System) Page web PDF Persistent identifier Preservation planning Publications électroniques Publications en ligne Publications numériques (born-digital) Publications numérisées (digitized) Publications officielles Publications universitaires robots.txt Serveur d’archive Serveur de documents SFTP (Secure File Transfer Protocol) Site web (site) Sites web dynamiques Sites web statiques Support de données Tableaux Tarball URN (Uniform Resource Name) Usenet (Newsgroup) Web Harvesting WebDAV Weblogs (Blogs) wget World Wide Web (WWW) XML (Extensible Markup Language) 2 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 Access Processus dans le modèle OAIS: mise à disposition des données d’archives pour l’utilisation. Administration Processus dans le modèle OAIS: surveillance des processus de travail dans le système d’archivage. Archivage à long terme Par archivage à long terme, on entend la saisie et la conservation à long terme d’informations. C’est surtout l’archivage à long terme d’informations existant sous forme numérique (digital preservation) qui pose de nouveaux problèmes. Archival Storage Processus dans le modèle OAIS: stockage des objets numériques dans le système d’archivage. Backup incrémentiel Un backup incrémentiel est basé sur le backup complet d’un système source. Il ne sauvegarde momentanément que les nouvelles données ajoutées. Pour restaurer des données avec succès, il faut utiliser le premier backup complet. Sur cette base, les backups incrémentiels sont ensuite remis dans le système par ordre chronologique ascendant. Bases de données Les bases de données sont des systèmes permettant de stocker et de gérer de grandes quantités de données. Une base de données contient des données déposées selon une structure définie et des programmes de gestion qui stockent les données, les recherchent ou exécutent d’autres opérations sur les données. Généralement on appelle aussi base de données un programme d’application pour l’organisation et la gestion structurées de données. Les contenus des bases de données sont répertoriés par des interfaces d’utilisation interactives (principalement propriétaires). Les utilisatrices/utilisateurs transmettent des demandes de recherche individuelles pour lesquelles sont préparés des résultats individuels. Cache Le cache est une mémoire tampon rapide, c’est-à-dire une mémoire dont l’accès aux contenus est spécialement rapide et dans laquelle les données utilisées à plusieurs reprises sont déposées temporairement. Data Management Processus dans le modèle OAIS: gestion et maintien des données d’archives par des métadonnées bibliographiques, techniques et administratives. Disponibilité à long terme Le maintien de la disponibilité à long terme d’objets numériques comprend toutes les mesures servant à faire en sorte que les objets numériques puissent encore être utilisés par les générations futures. Par générations futures, on entend une période illimitée dans le futur et pour laquelle il faut s’attendre - à de profonds changements technologiques dans le domaine du stockage et de l’accès aux objets numériques - au développement de nouveaux formats et supports de données et à l’élimination des anciens sur le marché - ainsi qu’à des changements décisifs dans le comportement des utilisateurs et l’apparition de nouveaux genres de contenus d’information. L’on distingue deux sortes de mesures de conservation de la disponibilité à long terme: - des mesures pour la conservation de la substance du flux de données des objets numériques (p.ex. par refreshing) - des mesures pour la conservation de l’utilisabilité (p.ex. par émulation ou migration). 3 DOI (Digital Object Identifier) Le digital object identifier (DOI) permet une identification univoque et permanente d’objets numériques. Le système du DOI est comparable à ceux de l’ISBN et de l’ISSN, mais va plus loin par sa fonction intégrée de localisation. Domain Un domain est un domaine défini par des caractéristiques communes; on entend généralement par là un groupe d’ordinateurs ayant des éléments de nom communs (host name). Le plus petit élément commun du nom se nomme top-level-domain, p.ex. l’abréviation du pays ".ch" ou l’abréviation ".com". Les domaines peuvent être divisés en sous-domaines qu’on appelle second-level-domain, third-level-domain etc. e-Helvetica Le terme e-Helvetica est composé de "e" pour électronique et de "Helvetica" pour désigner des publications en lien avec la Suisse. Le terme e-Helvetica désigne également le service de la BN qui a pour tâche la constitution, le catalogage, l'archivage à long terme et la mise à disposition de la collection numérique. e-Helvetica Access e-Helvetica Access est l'interface de consultation des collections numériques de la Bibliothèque nationale suisse (BN). Cette interface permet la recherche plein texte dans le contenu des publications numériques. Vous trouvez dans e-Helvetica Access les publications numériques qui sont dans les fonds de la BN. Actuellement sont répertoriées dans e-Helvetica Access les publications numériques originales tels que livres, périodiques, thèses et publications officielles ainsi que des sites web ayant un lien avec la Suisse. La collection est en cours de constitution. Outre la BN, des institutions partenaires y participent. Dans e-Helvetica Access vous trouvez aussi des publications qui ont été numérisées par la BN. e-Helvetica Deposit e-Helvetica Deposit est une plateforme permettant aux éditeurs de déposer des livres électroniques individuels. E-mail Un e-mail est un message (texte, fichiers) qui est transféré dans un réseau entre expéditeurs/trices et récepteurs/trices, par le service "Simple Mail Transfer Protocol" (SMTP). Emulation Stratégie en vue de conserver la disponibilité à long terme d’objets numériques. Selon cette stratégie, les conditions requises par le système pour pouvoir utiliser des objets numériques plus anciens peuvent être reproduites (émulées) par des logiciels spécialisés sur des systèmes actuels disponibles sur le marché. Les objets numériques eux-mêmes sont conservés si possible sans être modifiés. Diverses stratégies d’émulation en partie concurrentes (émulation du matériel contre émulation du logiciel) font l’objet de discussions. Format de fichier Pour réunir des données dans un fichier, il faut des règles définies. Un groupe de ces règles constitue un format de fichier. Les formats de fichier peuvent être très simples s’ils ne prescrivent par exemple que la simple succession des données. Mais ils peuvent aussi requérir le stockage d’informations complémentaires précises à des endroits définis dans le fichier. Ils peuvent également demander une codification précise des données et des informations stockées en plus. Jusqu’à la création d’un format d’archive approprié, le choix du format de fichier est crucial pour l’archivage à long terme de données numériques. Il est judicieux de choisir des formats de fichier largement répandus et utilisés par de nombreux programmes (p.ex. TIF pour les fichiers d’images); en effet, il est très probable que dans un futur assez proche il existe également des programmes permettant de récupérer les informations tirées des fichiers. Le choix de formats de fichier simples a une influence positive sur l’archivage à long terme (p.ex. TXT pour les fichiers texte) ; au besoin, ces formats faciliteraient une éventuelle reconstruction 4 ultérieure des règles ayant régi le regroupement des données. Par contre, les formats de fichier appartenant à un seul producteur (p.ex. DOC pour les fichiers texte) sont inappropriés car ce dernier peut les modifier ou en limiter l’utilisation à sa guise. Souvent, la terminaison du fichier permet de déduire le format de fichier. Format propriétaire Un format propriétaire est un format (structure de données, format de fichier ou de données) dont les spécifications ne sont pas disponibles ou accessibles ouvertement. Exemple : ‘.wma’ ou ‘.doc’. FTP (File Transfer Protocol) FTP est un protocole de transfert de fichiers dans l’Internet. FTP désigne également le service Internet sur lequel ce protocole est basé. Harvesting Le harvesting, aussi appelé webharvesting, est un système de collecte automatique de pages web au moyen d’un harvester (robot). Helvetica Les Helvetica sont des publications qui paraissent en Suisse, qui se rapportent à la Suisse ou à des personnes de nationalité suisse ou domiciliées en Suisse ou qui ont été créées par ou avec le concours d’auteurs ayant un lien avec la Suisse. Les Helvetica correspondent au domaine de collecte de la Bibliothèque nationale suisse. Helveticat Catalogue de la Bibliothèque nationale suisse. Homepage La homepage ou page d’accueil est la page d’entrée d’un fournisseur de pages web dans le World Wide Web. On désigne également sous ce nom le site web d’un particulier. Aujourd'hui, le mot ne désigne donc plus uniquement comme à l’origine la page d’entrée d’un site, mais l’ensemble de l’information proposée sur le site. HTTP (Hypertext Transfer Protocol) HTTP est un protocole de transfert pour le transfert de données dans le WWW ; il se base sur le protocole de transport TCP/IP. Hyperlien L’hyperlien, ou simplement lien, est le lien entre un élément dans un hypertexte ou sur une page Internet avec un autre élément sur la même page ou avec une autre page. Le terme dont part le lien est souligné et mis en évidence en couleur ; le lien est parfois aussi représenté par un graphique (un symbole). Ingest Processus dans le modèle OAIS: prise en charge des données du producteur, préparation pour l’archivage et intégration dans le système de stockage pour l’archivage à long terme. Internet L’Internet est le plus grand réseau d’ordinateurs du monde, il se compose de nombreux réseaux reliés entre eux et met à disposition une infrastructure de communication variée. Les prestations de l’Internet – on parle aussi de services – sont entre autres: l’ e-mail, le courrier électronique; World Wide Web (WWW), un système de documents basé sur l’hypertexte; Usenet, un forum de discussion; FTP, un système de transfert de toutes sortes de fichiers; IRC, le chat; Gopher, Telnet, Wais, Archie, et quelques anciens services dont l’importance décroît. Pour beaucoup d’utilisateurs privés, le WWW est la contribution la plus importante, c’est pourquoi cet élément est souvent considéré comme égal à l’Internet. 5 Intranet L’Intranet est un réseau privé (propre à une entreprise) qui travaille avec la technologie de l’Internet. Contrairement à l’Internet, l’Intranet n’est accessible qu’à un cercle restreint et local d’utilisateurs. JDBC (Java Database Connectivity) Java Database Connectivity (JDBC) est une interface de base de données de la plateforme Java qui offre une interface homogène entre des bases de données de différents producteurs et qui est spécialement adaptée aux bases de données relationnelles. Interface universelle entre bases de données, JDBC est comparable p.ex. à ODBC sous Windows ou DBI sous Perl. Etablir et gérer les connexions aux bases de données, transférer les requêtes SQL à la base de données, transformer les résultats en une forme utilisable par Java et les mettre à disposition du programme sont quelques-unes des tâches de JDBC. MARC MARC (Machine Readable Cataloging) est une norme largement utilisée pour la représentation et l’échange de données bibliographiques, d’autorité, de fonds, de classification et de données de renseignements communautaires lisibles par machine. Métadonnées Les métadonnées sont des données sur des données. Autrement dit, les métadonnées désignent des données qui décrivent d’autres données ou objets. Il s’agit donc d'informations sur des données qui facilitent au maximum l’accès aux données souhaitées ainsi que l’échange et la gestion de ces données. Ces informations de base contiennent p.ex. des indications sur l’auteur du document, la date de publication, des renvois à des documents sur le même sujet, etc. Les notices bibliographiques de publications sont donc des métadonnées. Dans le domaine électronique, les métadonnées n’incluent pas seulement des mentions bibliographiques, mais aussi des informations techniques et administratives (format et grandeur du fichier, date de reprise des données etc.). METS (Metadata Encoding & Transmission Standard) METS est un format XML défini au moyen d’un schéma XML, utilisé pour la description de collections numériques d’objets avec des métadonnées. Le format des métadonnées (MAB, MARC, Dublin Core etc.) peut varier et n’est pas défini par METS. En revanche, METS contient des éléments pour le groupement d’objets et leur mise en relation avec des métadonnées descriptives et administratives. METS permet par exemple de codifier des œuvres structurées de façon hiérarchique ou autre; une œuvre peut être une collection de livres, un livre structuré en chapitres et en pages, ou un film composé de plusieurs scènes. C’est un sous-ensemble du schéma XLink qui est utilisé pour relier les fichiers METS et les objets numériques dont il faut tirer des informations. Migration Stratégie de conservation de la disponibilité à long terme. Pour faire suite aux changements techniques que subit l’environnement, les objets numériques à conserver sont soumis à des procédures censées garantir leur utilisabilité dans les nouvelles conditions. MODS (Metadata Object Description Schema) MODS (Metadata Object Description Schema) est un standard de métadonnées de la Library of Congress. MODS est basé sur un schéma XML qui sert à décrire des données bibliographiques. NAS (Network Attached Storage) Network Attached Storage (NAS) désigne des serveurs de fichiers faciles à gérer. NAS est utilisé pour mettre à disposition sans grand investissement une capacité de stockage indépendante dans un réseau d’ordinateurs. A la différence d’un Direct Attached Storage, un NAS est est un hôte autonome ayant son propre système d’exploitation. Comme les fonctions sont adaptées très spécifiquement à leur utilisation, des erreurs qui seraient dues à des possibilités de configuration étendues et superflues pour leur utilisation spécifique peuvent être évitées dès le départ. Les services basés sur les fichiers comme NFS ou SMB/CIFS sont la fonction principale. Pour cette raison, les systèmes NAS sont souvent appelés filers. 6 Un disque dur courant qui se trouve dans un boîtier externe équipé d’une prise réseau RJ-45, du firmware correspondant et, en option, d’autres possibilités de connexion, correspond déjà à un NAS. NFS (Network File System) Le Network File System – en abrégé NFS (aussi appelé Network File Service) – est un protocole développé par Sun Microsystems qui permet d’accéder à des fichiers via un réseau. Les fichiers ne sont pas transmis comme p.ex. avec FTP, mais les utilisateurs peuvent accéder aux fichiers qui se trouvent sur un ordinateur distant comme s’ils étaient stockés sur leur disque dur local. Ninive Ninive est le système de stockage de la Bibliothèque nationale suisse pour l’archivage à long terme. Numérisation La numérisation d’objets analogiques recourt à des interventions dans des domaines divers. L’objectif prioritaire est de faciliter l’accès des utilisateurs aux contenus et de conserver le contenu des objets menacés de dégradation. Des mesures pour l’archivage à long terme des objets numériques sont nécessaires pour garantir le futur des interventions réalisées. OAI (Open Archives Initiative) Interface standardisée pour l’échange de métadonnées sur la base de 'Open Archive Initiative Protocol for Metadata Harvesting', qui permet de faire des recherches à l’aide de métadonnées dans les fonds d’archives documentaires scientifiques de renommée. OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting) OAI-PMH est un protocole d'échange de métadonnées. Il permet à un serveur de documents de récolter et d’indexer des métadonnées appartenant à d'autres serveurs de documents compatibles OAI-PMH, de façon à ce que les recherches lancées dans son propre moteur de recherche puissent englober les documents hébergés par ces autres serveurs. Un serveur compatible OAI-PMH peut être à la fois fournisseur et moissonneur de métadonnées. OAIS (Open Archival Information System) Ce modèle de référence certifié ISO 14721 décrit une archive comme une organisation dans laquelle des hommes et des systèmes œuvrent ensemble dans le but de conserver des informations et de les mettre à disposition d’un cercle d’utilisateurs défini. Etre conforme à OAIS suppose un engagement à respecter les conditions-cadre définies dans le modèle de référence. Le modèle de référence ne spécifie ni le design, ni l’implémentation d’une archive conforme à OAIS. Page web Une page web est une page d’un fournisseur d'information sur la Toile (ou World Wide Web). La page web est à distinguer du site web. Un site web se compose habituellement d’un groupe de pages web ordonnées hiérarchiquement et dont la page principale est appelée homepage ou page d’accueil. PDF Format de fichier basé sur Postscript et créé par l’entreprise Adobe pour la représentation de documents dans leur mise en page d’origine (p.ex. sauts de page fixes, placement d’illustrations). PDF n’est donc pas seulement intéressant pour les publications commerciales, mais aussi pour les publications scientifiques, surtout dans l’optique du problème de la citation dans les documents électroniques. L’aptitude de PDF comme format d’archivage à long terme est contestée car bien qu’il soit ouvert, il s’agit d’un format propriétaire. Pour un sous-ensemble du format (PDF/A = Archive), un processus de standardisation (ISO 19005-1. Document management - Electronic document file format for long-term preservation - Part 1: Use of PDF (PDF/A)) a été introduit pour favoriser une plus grande acceptation du format à des fins d’archivage à long terme. 7 Persistent identifier Les persistent identifiers sont des identificateurs uniques d’objets numériques, indépendants de l’emplacement, qui garantissent en même temps l’accès durable à des ressources électroniques. La Bibliothèque nationale suisse attribue de tels identificateurs sur la base du National Bibliography Number (NBN). Preservation planning Processus dans le modèle OAIS: planification et mise en oeuvre des mesures de conservation à long terme sur les objets numériques dans le système d’archivage. Publications électroniques Par publications électroniques, on entend aussi bien les publications online que les publications offline. On utilise aussi l’expression publications numériques. Publications en ligne Les publications en ligne (ou online) sont un sous-ensemble des publications électroniques. Les publications en ligne sont publiées et diffusées sur Internet sans support physique. Elles apparaissent sous toutes sortes de formats de données et de formes de présentation. Exemples: revue électronique, base de données, newsletter par e-mail, etc. Autres expressions utilisées: publications en réseau, publications électroniques non physiques, publications non physiques. Publications numériques (born-digital) Les publications numériques sont des publications numériques originales. Fabriquées sur support numérique, elles n’existent que sous cette forme. Publications numérisées (digitized) Les publications numérisées sont des publications converties de l’analogique (papier p. ex.) au numérique. Publications officielles Les publications officielles sont des informations imprimées ou conservées sur d’autres supports que le papier et qui sont publiées par une unité de l’Administration fédérale centrale. Publications universitaires Par publications universitaires, on entend les thèses et les thèses d’habilitation qui sont publiées dans une université. robots.txt Après convention du protocole d’exclusion des robots, lorsqu’un webcrawler (robot) trouve une page web, il lit d’abord le fichier robots.txt (écrit en minuscules) dans le répertoire racine (root) d’un domaine. Dans ce fichier, on peut spécifier si la page web peut être visitée par un webcrawler, et de quelle manière. Les exploitants de sites web ont donc la possibilité de bloquer des domaines choisis de leur présence web pour certains moteurs de recherche. Le protocole est purement indicatif et dépend de la collaboration du webcrawler. On parle de webcrawlers «aimables». L’exclusion de certaines parties d’une présence web par le protocole n’en garantit pas la dissimulation ; à cet effet, un fichier .htaccess permet de protéger des pages ou des sous-répertoires d’un serveur. Certains moteurs de recherche affichent quand même dans leurs pages de résultats les URL trouvées par un webcrawler, mais sans la description des pages. Serveur d’archive Le serveur d’archive désigne une infrastructure technique et organisationnelle dont la tâche prioritaire est le stockage, la gestion et l’archivage à long terme d’objets numériques. Dans le contexte de l’archivage à long terme, on sépare les systèmes du type serveur d’archive des systèmes du type serveur de documents, ceci dans le but de distinguer chacun des axes essentiels de la fonctionnalité. 8 Serveur de documents Un serveur de documents désigne un système technique et organisationnel dont l’axe principal est la mise à disposition de documents numériques (ou d’objets similaires à des documents) à l’utilisateur final. Un serveur de documents coopère avec un serveur d’archive ou un système de dépôt afin de garantir la disponibilité à long terme des objets à mettre à disposition. SFTP (Secure File Transfer Protocol) SFTP, aussi appelé Secure FTP (protocole sécurisé de transfert de fichiers) est une variante du protocole FTP qui tunnelise la session à travers une connexion secure shell pour la sécuriser. Site web (site) Un site web se compose généralement de plusieurs pages web ordonnées hiérarchiquement. Sites web dynamiques Dans le contexte bibliothéconomique, les sites web dynamiques sont des publications qui ne sont pas achevées au moment de leur première publication. Elles peuvent être modifiées et augmentées dans des mesures et à des fréquences variables (ressources intégratrices). Sites web statiques Dans le contexte bibliothéconomique, les sites web statiques sont des publications achevées au moment de leur première parution et qui ne subiront donc plus aucune modification a posteriori (ressource monographique). Les "versions" de sites web statiques modifiées sur le fond sont considérées comme de nouvelles publications en ligne. Support de données Média de stockage pouvant être traité de façon mécanique ou électronique, et sur lequel sont stockées durablement des données numériques qui peuvent en être à nouveau extraites. A titre d’exemples, on peut citer les supports de données magnétiques (disquettes, bandes magnétiques) et optiques (CDROM, DVD). Tableaux Les tableaux sont des pages définies dans un mailbox (Bulletin Board System) ou un newsgroup dans lesquels les utilisateurs/trices peuvent échanger des informations – comme un avis accroché au panneau d’affichage. Tarball Tar est le nom d’un logiciel d'archivage de fichiers standard d'Unix; il désigne également le fichier d'archive créé par ce programme et dont l’extension est .tar. Le nom «tar» vient de l’anglais tape archiver (littéralement «archiveur pour bande»). Tar offre la possibilité de concaténer un grand nombre de fichiers en un seul et de recréer les fichiers à partir de ce dernier. On appelle parfois le fichier d'archivage créé un tarball. Le type MIME pour le fichier .tar est application/x-tar. URN (Uniform Resource Name) Un URN (Uniform Resource Name) est un Persistent Identifier. Les Persistent identifiers peuvent remplacer les URL (Uniform Resource Locator; „lien“ dans l’Internet) dans le catalogue ou dans d’autres systèmes de recensement, ou être utilisés comme références stables dans les documents eux-mêmes, ce qui permet d’avoir des liens stables. La mise à jour des références prend moins de temps puisque les URL sont mis à jour de façon automatisée en un seul endroit. Les liens peuvent être intégrés à plusieurs services de recensement. Les publications numériques ont un identificateur unique au monde et peuvent donc être citées de manière fiable. L’URN garantit un accès durable à un objet. L’accès durable est garanti par l’archivage à long terme ou l’archivage des objets ainsi que par la haute disponibilité technique du service URN. Un URN renvoie au moins à un URL par lequel un objet est adressé. Un URN peut également gérer plusieurs copies du même objet, donc plusieurs URL, ainsi que différents formats de présentation des objets. 9 Usenet (Newsgroup) Usenet est un réseau de forums ou groupes de discussion qui est en principe indépendant de l’Internet. Une autre désignation pour Usenet est Newsgroup, ce qui peut toutefois créer des malentendus. Un newsgroup n’est en réalité qu’une partie – peut-être très petite – de Usenet qui traite un thème précis. Mais il existe aussi des newsgroups en dehors de Usenet à proprement parler, par exemple dans les intranets d’entreprises ou dans des écoles ou universités. Web Harvesting Voir Harvesting. WebDAV WebDAV (Web-based Distributed Authoring and Versioning) est un standard ouvert permettant de mettre à disposition des fichiers dans l’Internet. Les utilisateurs peuvent accéder à leurs données comme sur un disque dur en ligne. Des exemples connus sont l’iDisk, le disque dur virtuel sur Internet d’Apple, le GMX MediaCenter ou le disque dur en ligne aon (aon-Online-Festplatte) de Telekom Austria. D’un point de vue technique, WebDAV est une extension du protocole HTTP/1.1 qui lève certaines restrictions de HTTP. Jusqu’ici, les formulaires en ligne ne permettaient la plupart du temps que l’upload de fichiers individuels (HTTP-POST). Avec WebDAV, il est possible de transmettre des répertoires entiers. De plus, le contrôle des versions est spécifié. Weblogs (Blogs) Un weblog, en général simplement appelé blog, est un site web qui contient périodiquement de nouvelles entrées. Un weblog est une sorte de journal intime virtuel dans lequel l’auteur (blogger) note des pensées personnelles et des liens commentés vers des sources Internet qu’il/elle a visitées. wget GNU Wget est un logiciel libre en ligne de commande qui sert à télécharger des ressources (fichiers, pages web etc.) via un réseau. ftp, http et https sont quelques-uns des protocoles supportés. La première version, écrite par Hrvoje Niksic, date de 1995. Ce programme existe pour UNIX et GNU/Linux ainsi que pour OS/2, Windows et SkyOS. Il est sous la GNU General Public License et fait partie du projet GNU. Le protocole a été développé en 1994 par un groupe indépendant, mais entre-temps il est unanimement reconnu et peut être considéré comme un quasi-standard. ACAP 1.0 (Automated Content Access Protocol), publié le 30.11.2007, est une extension possible du protocole d’exclusion des robots. Au début juin 2008, Google, Microsoft et Yahoo ont reconnu quelques points communs. World Wide Web (WWW) Le World Wide Web est un système hypermédia pour l’Internet développé en 1989 au Centre européen de recherche nucléaire CERN. Le WWW permet d’accéder à toutes sortes de documents stockés sous forme numérique sur un ordinateur qui se trouve quelque part dans le monde et qui est relié avec le WWW. Les documents sont des textes normaux, des hypertextes, mais aussi des fichiers de musique et d’images ainsi que des films. Le World Wide Web et l’Internet ne sont pas identiques, mais le World Wide Web se base sur l’Internet. Toutefois, la plupart des surfeurs et surfeuses sur Internet utilisent exclusivement le World Wide Web pour leurs activités. Le World Wide Web utilise le protocole de transmission HTTP; il existe encore d’autres protocoles dans l’Internet, p.ex. FTP. La majorité des documents texte dans le WWW est aujourd’hui créée dans la langue de description de pages HTML, dont les hyperliens sont la caractéristique principale. Ces derniers permettent d’appeler à partir d’un document n’importe quel autre document qui est accessible dans le WWW à l’aide d’une procédure d’adressage standardisée et en utilisant le protocole HTTP. A côté de HTML, il existe encore une multitude d’autres formats de données pour les textes et autres types de documents. XML (Extensible Markup Language) L’Extensible Markup Language, abrégé XML, est un standard pour la création de documents lisibles par les machines et par les hommes. XML définit les règles pour la création de ces documents. Pour chaque cas concret d’application (application XML), il s’agit de spécifier les détails des documents en question. XML est donc un standard pour le définition de n’importe quel langage de composition; ces langages étant toutefois fortement apparentés de par leur structure de base. Les structures XML ont de bonnes 10 propriétés pour la disponibilité à long terme car il s’agit d’un standard ouvert offrant de nombreuses possibilités de structuration pour les types d’objets les plus divers. Les structures XML sont interprétables par machine car elles suivent des règles formelles. 11
Documents pareils
Archives Web Suisse : glossaire, version 1.6, 5 février 2016
L’Internet est le plus grand réseau d’ordinateurs du monde, il se compose de nombreux réseaux reliés entre eux et met à disposition une infrastructure de communi-cation variée. Les prestations de l...
Le projet e-Helvetica de la Bibliothèque nationale suisse
possibilités de recherche aussi attrayantes que possible et être mise à disposition dans
une large mesure sur l’Internet.
Même si l’idée de conserver des parties de l’information publiée dans l’Int...