Formats d`échange
Transcription
Formats d`échange
Système d'information de Gestion L'échange de données Les échanges de données peuvent se produire au sein d'un même ordinateur (entre deux applications) ou entre plusieurs ordinateurs. Ils peuvent aller du simple échange de fichier à l'intervention d'intermédiaires de services (web services). Chaque application ou chaque système gère ses données dans un certain format : Format propriétaire Un format est dit «propriétaire» si sa spécification (description) n'appartient pas au domaine public et est conservée secrète par le constructeur. Il s'agit de formats développés par une entreprise afin de coder les données de ses applications. Seuls les logiciels produits par cette entreprise seront donc capables de lire correctement et complètement les données dans un fichier au format « propriétaire ». Le récepteur du document est obligé d'utiliser le même logiciel que l'émetteur du document. Format ouvert Un format est dit « ouvert » si ses spécifications appartiennent au domaine public. Il s'agit principalement de standards établis par des autorités publiques ou des institutions internationales, dont le but est de fixer des normes assurant l'interopérabilité entre logiciels. La direction générale de la modernisation de l'État (DGME) publie des recommandations quant à l'utilisation de formats de fichiers « ouverts ». Il existe toutefois plusieurs cas de formats « ouverts» promus par des entreprises ayant décidé de rendre publique la spécification de leurs formats. L'interopérabilité des applications impose l'existence d'un format d'échange de données commun. La coexistence de différents formats nécessite l'utilisation de programmes d'interfaçage ou d'importexport. Principales caractéristiques des formats d'échange de données: Format propriétaire Format ouvert Spécification Par un éditeur, parfois non publiée Publique, librement exploitable et protégée Contexte Éditeur de progiciel, de SGBD, de Souvent logiciels libres d'utilisation système d'exploitation Avantages Portabilité (le format est accepté par plusieurs logiciels) Évolution maîtrisée (accès au code source et aux spécifications) Inconvénients Dépendance vis à vis de l'éditeur, Interopérabilité non garantie avec d'autres produits (liée à l'existence de convertisseur) Le format PDF Le format PDF (Portable Document Format), développé par Adobe, est un format de présentation de documents dont la spécification est disponible sur le Web. Il s'agit d'un format universel représentant un document de façon indépendante du matériel, du système d'exploitation et du programme utilisé pour créer le fichier. Il est compatible avec toute imprimante, sans perte de qualité, et surtout, avec conservation de la mise en page définie par l'auteur du document. La création de documents PDF nécessite le logiciel Adobe Acrobat Writer, mais il est possible de les obtenir en sous produits des logiciels bureautiques. Des convertisseurs existent dans les deux sens. PDFCreator permet de transformer des documents bureautiques en format PDF via une imprimante virtuelle. La transformation de document PDF en document Word est possible, mais payante. Avec le développement spectaculaire de l'Internet, le format PDF est devenu l’un des formats les plus courants pour l'échange de documents. Largement utilisé dans toutes les entreprises et par les particuliers, le format PDF présente les caractéristiques suivantes: © Jacques Chambon 1/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion • • • • • • • • préservation de la mise en forme du document quel que soit l’ordinateur ou la plate- forme utilisés; fusion des contenus de différentes sources; édition collective de documents en utilisant des plate-formes multiples; signatures numériques pour l'authentification; sécurisation et autorisations pour garantir la maîtrise du contenu; accessibilité du contenu à des personnes handicapées; extraction du contenu et réutilisation dans d’autres formats de fichier; et recueil de données et intégration avec des systèmes opérationnels utilisant le format PDF. La norme, ISO 32000-1, Gestion de document – Format de document portable – Partie 1: PDF 1.7, concerne la version 1.7 du format PDF développée par Adobe. Cette Norme internationale fournit les informations essentielles requises pour le développement de logiciels qui créent des fichiers PDF (auteurs conformes), de logiciels qui lisent les fichiers PDF classent et interprètent leur contenu pour l'affichage et l'interaction (lecteurs conformes), et de produits PDF qui lisent et/ou écrivent des fichiers PDF pour une série d'autres finalités (produits conformes). Le format HTML HTML (Hypertext markup Language) est un langage à balises (une balise est un repère, mot clé annonçant qu'un certain type de données va suivre) permettant de définir ou lire des pages Web provenant de différents serveurs utilisant le protocole http (hyper text transfer protocol) : • des instructions HTML permettent de décrire une présentation (taille des caractères, couleurs, polices) et d'intégrer des textes ou des images au document; • des liens hypertextes relient les éléments qui font référence à des adresses locales ou à des adresses web. Un site web se construit à l'aide de pages HTML rangées sur un serveur, accessibles par les internautes et affichées par leurs navigateurs. Une page HTML est un texte (un script) qui peut être écrit avec un simple traitement de texte. Toutefois, des utilitaires permettent de générer graphiquement des pages HTML sans écrire directement le code HTML. Avantages Inconvénients – Interopérabilité entre navigateurs – – Langage simple composé de balises permettant de mettre en forme un document produit avec n'importe quel éditeur de texte brut et de conserver la présentation générale d'un document Nombreuses balises destinées à régler davantage la présentation plutôt que le contenu (ex. : <B> pour le gras, d> pour l'italique, <TT> pour les polices à pas fixe, etc.) – HTML non approprié à la description du contenu – HTML pas assez flexible pour répondre à l'immense variété des documents candidats à la publication électronique – Structure distribuée (liens externes) rendant difficile le stockage: risque de perdre ou d'oublier un élément lié sans s'en rendre compte – – Standardisation des feuilles de style et des cadres (trames) à partir de la version 4.0 du langage HTML Gestion d'options multimédia Les balises HTML Les balises sont encadrées par < et >. Chaque balise d'ouverture est accompagnée d'une balise de fermeture notée < / >. Un document HTML débute par la balise <HTML> et se termine par </HTML>. <TITLE>Présentation des balises HTML</TITLE> permet de définir le titre de la page HTML. L'emboitement de balises est possible. <B><I>Présentation des balises</I></B> affiche le texte concerné en italiques gras. HTML permet de définir des liens hypertextes vers d'autres documents. © Jacques Chambon 2/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion <HTML> Déclaration d'un document HTML <HEAD> Déclaration de l'en tête de page Web <META...> Propriétés de la page ( nom de l'auteur,description, mots clé de la page...) <TITLE> Titre de la page <BODY> Corps de la page <IMG> Insertion d'une image <BR> Passage à la ligne suivante (pas de balise de fermeture pour cette action) <B> Caractère gras <I> Écriture en italique <BIG> Écriture en grands caractères <FONT COLOR=#FF0000> Couleur de police (ici couleur rouge définie par le code FF0000), La couleur implicite est noire pour les textes courants. <UL> Permet de présenter une liste d'éléments (avec puce mais sans numérotation). <OL> Permet de présenter une liste d'éléments numérotés <LI> Permet d'ajouter un élément à une liste <FORM> Délimite un formulaire à compléter en ligne par un internaute et retourné au serveur Web <A> Lien hypertexte, Indiquer l'URL de destination grâce à HREF= " autredocument.HTML " (le texte s'affiche implicitement en souligné) Remarque : Pour tester un code html, il est possible de l'écrire à l'aide d'un générateur de texte (comme Notepad de Microsoft) puis de changer l'extension .txt du fichier par .html pour que le code soit ouvert et exécuté à l'aide du navigateur internet disponible sur l'ordinateur. Le langage XML Le XML (Extensible Markup Language) est un langage à balises qui a pour objectif de décrire les informations indépendamment de toute application. Le XML permet de transférer des données entre des applications différentes. Le XML est né du besoin de : • créer un standard d'échange universel simplifié mais puissant pour transporrter les données sur le Web, mais aussi permettre à deux applications de dialooguer entre elles quel que soit le langage ayant servi à leur développement et à leur environnement d'exécution; • structurer des documents complexes (séparation de la mise en page et du contenu) ; • définir précisément l'information contenue dans un document et aider à la recherche de ces informations. Contrairement au HTML, qui est à considérer comme un langage figé (avec un nombre de balises limité), le XML est un métalangage de balisage, c'est-à-dire un langage permettant de créer des langages de balises. Il permet d'inventer à volonté de nouvelles balises afin de mettre en relief la structure logique d'un document et de faciliter l'accès direct aux données, aussi bien par l'être humain que par les programmes informatiques dédiés. Avantages © Jacques Chambon Limites 3/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion • Flexibilité: il est possible de créer des balises afin de répondre à des besoins spécifiques. • Déployabilité : il peut être distribué par n'importe quels protocoles à même de transporter du texte, comme http. • Extensibilité: un document XML est utilisable dans de nombreux domaines d'application. • Structuration: le XML tient du SGML,un respect très strict de la structure. Comme le SGML, le XML dispose d'une structure. • Description: les éléments XML servent exclusivement à décrire la signification de leur contenu. • Facilité à apprendre tant au niveau de la création de documents XML que de l'écriture des programmes traitant les documents XML. • Vulnérabilité des documents lors des échanges sur un réseau non sécurisé comme Internet car ils contiennent de l'information sur leurs structurations, ce qui facilite le travail d'interprétation des malfaiteurs qui essaient d'y accéder frauduleusement. • Les standards sécuritaires en vigueur actuellement pour pallier ces inconvénients sont XML Signature et XML Encryption. • Les signatures XML sont des signatures numériques conçues pour être utilisées dans les transactions XML. • La signature numérique obtenue par chiffrement permet d'authentifier l'émetteur d'un message et d'en vérifier l'intégrité. • Le chiffrement/déchiffrement XML a pour objectif de permettre le chiffrement de (parties) de données XML échangées. Pour ouvrir une étape consacrée au nom d'un client (Vial), on doit utiliser deux balises (l'une est ouvrante et l'autre est fermante <nom_client>Vial</nom_client». Les balises doivent notamment respecter les règles suivantes: • les noms des balises contiennent des lettres, chiffres ou autres caractères, ils ne peuvent ni débuter par les lettres xml (majuscules ou minuscules), ni contenir d'espace ; • l'ouverture et la fermeture des balises doivent respecter l'arborescence du document; • les noms balises doivent être en cohérence avec les contenus. Un document XML qui respecte toutes les contraintes syntaxiques est dit « bien formé» (dans le cas contraire, on le dit « mal formé» ). EXEMPLE •. Document XML bien formé: <corps_du_document> <titre> <paragraphe> Respecter l'ordre d'imbrication des balises </paragraphe> </titre> </corps_du_document> Document XML bien formé: <corps_du_document> <titre> © Jacques Chambon 4/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion <paragraphe> Respecter l'ordre d'imbrication des balises </paragraphe> </titre> </corps_du_document> <title>Dunod Editeur, édition de livres, Microsoft Press, ETSF, alsclence, rnter~dTt~<7lTtle::> Extrait n° 2 <A H RE F= http://www.dunod.com/recherche-livre-collection-dunod.html >Collections<1 A> Questions 1) Quelles sont les deux premières balises présentes sur ce code source? À quoi servent ces balises? 2) Quelles sont les balises permettant de présenter de litre du document source « Dunod Editeur, édition de livres ... Il ? 3) Quel est le rôle de la balise <A HREF=" "> et <lA>? CAS 12.2 Belass l'association Belass, qui regroupe des joueurs de belote de votre commune, envisage de créer un site Web. Pour tester la procédure d'hébergement par le fournisseur d'accès internet, vous décide de créer une première page web très simple nommée Association BELASS et qui se présente ainsi Association de joueurs de belote BELASS 128 rue des Dunes 56410 ETEL Téléphone: 02 97 10 10 10 Tournoi du mois d'avril en partenariat avec l'amicale laïque FADOR L'association BELASS propose à ses adhérents de : © Jacques Chambon 5/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion 1. S'inscrire au tournoi en téléphonant à l'association BELASS 2. Se rendre sur le site de l'amicale laïque F ADOR pour les modalités Cliquer ici pour accéder à l'amicale laïque du F AD OR <:adt~:5317057Z0 lo<:aate:5 </commande entete> <xmLclient> <nom>Bergsson</Nom> <societe> KRAFLA<$ociete> <adresse_rue>9 rue des dunes</adresses_rue> <ad resse _code_posta 1>44000</ ad resse_code_postal> <article> <id entifia nt>0002 3 45</identifia nt> <designation>sac de couchage polaire</designation> <quantite_valeur="lO" /> <prix_unitaire_ht="123,45" /> <commande> Corrigé sur le site www.expert-sup.com Ce chapitre introduit les principaux formats d'échange de docum posant une distinction entre format « propriétaire» et format « Ol ensuite étudiés un format de présentation de documents (PDF) et à balises (HTMl et XMl). IIII Le langage à balises La création de pages pouvant être lues par des navigateurs sur le réseau 1 net nécessite le recours au HTML, qui est un langage à balises (markup) dc rôle est de formaliser l'écriture d'un document grâce à des balises de forma Une balise est une suite de mots sans distinction entre majuscules et mi cules entre <xx> (balise de début) et </xx> (balise de fin). La balise donnl informations de structure ou de présentation à un texte qu'elle encadre p balise de début et la balise de fin. Elles permettent d'indiquer la façon dont être présenté le document et les liens qu'il établit avec d'autres docum, Toutefois, pour pallier les faiblesses du HTML présentées ci-après, un mét. gage à balises est né: le XML (eXtensible Markup Language). A. Le format HTML 1. La présentation du format HTML Le HTML (HyperText Markup Language) est un langage de balisage stan utilisé pour les documents sur Internet. Il est issu de la norme SGML (~ dardized Generalized Markup Language), qui définit des © Jacques Chambon 6/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion langages de balisai a été mis au point par Tim Berners-Lee, chercheur, à partir de 1989. Toute ce n'est qu'à partir de 1993 que l'on fait référence au langage HTML. Il é construit pour décrire les documents hypertexte sur Internet. Le HTML e~ standard normalisé par le W3C (World Wide Web Consortium - consor1 regroupant de nombreuses entreprises et organisations). La normalisa Systèmes d'information de gestion 2. Les groupes de balises Les balises peuvent être regroupées suivant leurs fonctions (tableau 12.2). Tableau 12.2 - Les fonctions des groupes de balises Groupe de balises Fonction Balises de structure de document: <HTML>, Un document HTML est composé de trois <HEAD>, <BASE>, <1SINDEX>, <META>, membres principaux: la déclaration HTML, <BODY> l'en-tête (HEAD) et le corps (BODY). Les balises de structure de document servent à circonscrire ces membres. Balises de formatage: <B>, <BASEFONT>, Les balises de formatage permettent de jouer <BIG>, <FONT>, <1>, <BODY> sur la présentation du contenu. Balises de liste: <LI>, <DIR>, <DL>, <DT>, Le HTML supporte cinq types de listes: <DD>, <MENU>, <01>, <UL> -listes de définitions; -listes répertoires; -listes menus; -listes numérotées; -listes à puces. Balises d'hyperliens : <A> Les hyperliens permettent de passer d'un document HTML à un autre. Balises d'images et d'imagemaps : Des éléments graphiques peuvent être <1MG>, <MAP> et <AREA> insérés. Balises de tableaux : Les tableaux HTML offrent un moyen clair <TABLE>, <CAPTION>, etc. et net de présenter l'information. -.e-- définir précisément l'information contenue dans un document et aider à la recherche de ces informations. Contrairement au HTML, qui est à considérer comme un langage figé (avec un nombre de balises limité), le XML est un métalangage de balisage, c'est-à-dire un langage permettant de créer des langages de balises. Il permet d'inventer à volonté de nouvelles balises afin de mettre en relief la structure logique d'un document et de faciliter l'accès direct aux données, aussi bien par l'être humain que par les programmes informatiques dédiés. © Jacques Chambon 7/8 22-COURS_SI_logiciel_Formats_Echange Système d'information de Gestion Tableau 12.4 - Avantages et limites du XML Avantages Limites - Flexibilité: il est possible de créer des - Vulnérabilité des documents lors des balises afin de répondre à des besoins échanges sur un réseau non sécurisé spécifiques. comme Internet car ils contiennent - Déployabilité : il peut être distribué de l'information sur leurs structurations, par n'importe quels protocoles à même ce qui facilite le travail d'interprétation de transporter du texte, comme http. des malfaiteurs qui essaient d'y accéder - Extensibilité: un document XML est frauduleusement. utilisable dans de nombreux domaines - Les standards sécuritaires en vigueur d'application. actuellement pour pallier ces inconvénients - Structuration: le XML tient du SGML, sont XML Signature et XML Encryption. un respect très strict de la structure. - Les signatures XML sont des signatures Comme le SGML, le XML dispose numériques conçues pour être utilisées d'une structure. dans les transactions XML. - Description: les éléments XML servent - La signature numérique obtenue exclusivement à décrire la signification par chiffrement permet d'authentifier de leur contenu. l'émetteur d'un message et d'en vérifier - Facilité à apprendre tant au niveau l'intégrité. de la création de documents XML que - Le chiffrement/déchiffrement XML a pour de l'écriture des programmes traitant objectif de permettre le chiffrement les documents XML. de (parties) de données XML échangées. Les formats d'échange Format PDF Le Portable Document Format (PDF), est un format de fichier informatique créé par Adobe Systems Le format PDF préserve les polices, les images, les objets graphiques et la mise en forme de tout document source, quelles que soient l'application et la plate-forme utilisées pour le lire. Le format PDF peut aussi être interactif : il est en effet possible d'incorporer des champs de textes, des notes, des corrections, des menus déroulant, des choix, des calculs, etc. On parle alors de formulaire PDF. C'est pourquoi ce format est utilisé dans un ensemble large et varié de logiciels, de l'exportation dans les suites bureautiques grand public, aux manipulations par des programmes spécialisés de l'industrie artistique. Les fichiers PDF peuvent être créés avec des options personnalisées, tant aux niveaux de la compression des images et des textes, de la qualité d'impression du fichier, que du verrouillage (interdiction d'impression, de modification…). Le PDF s'est imposé comme format d'échange (consultation écran, impression, etc...) et d'archivage de documents électroniques. © Jacques Chambon 8/8 22-COURS_SI_logiciel_Formats_Echange