Formats d`échange

Transcription

Formats d`échange
Système d'information de Gestion
L'échange de données
Les échanges de données peuvent se produire au sein d'un même ordinateur (entre deux
applications) ou entre plusieurs ordinateurs. Ils peuvent aller du simple échange de fichier à
l'intervention d'intermédiaires de services (web services).
Chaque application ou chaque système gère ses données dans un certain format :
Format propriétaire
Un format est dit «propriétaire» si sa spécification (description) n'appartient pas au domaine public et
est conservée secrète par le constructeur. Il s'agit de formats développés par une entreprise afin de
coder les données de ses applications. Seuls les logiciels produits par cette entreprise seront donc
capables de lire correctement et complètement les données dans un fichier au format « propriétaire
».
Le récepteur du document est obligé d'utiliser le même logiciel que l'émetteur du document.
Format ouvert
Un format est dit « ouvert » si ses spécifications appartiennent au domaine public. Il s'agit
principalement de standards établis par des autorités publiques ou des institutions internationales,
dont le but est de fixer des normes assurant l'interopérabilité entre logiciels.
La direction générale de la modernisation de l'État (DGME) publie des recommandations quant à
l'utilisation de formats de fichiers « ouverts ». Il existe toutefois plusieurs cas de formats « ouverts»
promus par des entreprises ayant décidé de rendre publique la spécification de leurs formats.
L'interopérabilité des applications impose l'existence d'un format d'échange de données commun. La
coexistence de différents formats nécessite l'utilisation de programmes d'interfaçage ou d'importexport.
Principales caractéristiques des formats d'échange de données:
Format propriétaire
Format ouvert
Spécification
Par un éditeur, parfois non publiée Publique, librement exploitable
et protégée
Contexte
Éditeur de progiciel, de SGBD, de Souvent logiciels libres d'utilisation
système d'exploitation
Avantages
Portabilité (le format est accepté par plusieurs
logiciels) Évolution maîtrisée (accès au code
source et aux spécifications)
Inconvénients Dépendance vis à vis de l'éditeur,
Interopérabilité non garantie avec
d'autres produits (liée à l'existence
de convertisseur)
Le format PDF
Le format PDF (Portable Document Format), développé par Adobe, est un format de présentation de
documents dont la spécification est disponible sur le Web. Il s'agit d'un format universel représentant
un document de façon indépendante du matériel, du système d'exploitation et du programme utilisé
pour créer le fichier. Il est compatible avec toute imprimante, sans perte de qualité, et surtout, avec
conservation de la mise en page définie par l'auteur du document.
La création de documents PDF nécessite le logiciel Adobe Acrobat Writer, mais il est possible de les
obtenir en sous produits des logiciels bureautiques. Des convertisseurs existent dans les deux sens.
PDFCreator permet de transformer des documents bureautiques en format PDF via une imprimante
virtuelle. La transformation de document PDF en document Word est possible, mais payante.
Avec le développement spectaculaire de l'Internet, le format PDF est devenu l’un des formats les
plus courants pour l'échange de documents. Largement utilisé dans toutes les entreprises et par les
particuliers, le format PDF présente les caractéristiques suivantes:
© Jacques Chambon
1/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
•
•
•
•
•
•
•
•
préservation de la mise en forme du document quel que soit l’ordinateur ou la plate- forme
utilisés;
fusion des contenus de différentes sources;
édition collective de documents en utilisant des plate-formes multiples;
signatures numériques pour l'authentification;
sécurisation et autorisations pour garantir la maîtrise du contenu;
accessibilité du contenu à des personnes handicapées;
extraction du contenu et réutilisation dans d’autres formats de fichier; et
recueil de données et intégration avec des systèmes opérationnels utilisant le format PDF.
La norme, ISO 32000-1, Gestion de document – Format de document portable – Partie 1: PDF 1.7,
concerne la version 1.7 du format PDF développée par Adobe. Cette Norme internationale fournit les
informations essentielles requises pour le développement de logiciels qui créent des fichiers PDF
(auteurs conformes), de logiciels qui lisent les fichiers PDF classent et interprètent leur contenu pour
l'affichage et l'interaction (lecteurs conformes), et de produits PDF qui lisent et/ou écrivent des
fichiers PDF pour une série d'autres finalités (produits conformes).
Le format HTML
HTML (Hypertext markup Language) est un langage à balises (une balise est un repère, mot clé
annonçant qu'un certain type de données va suivre) permettant de définir ou lire des pages Web
provenant de différents serveurs utilisant le protocole http (hyper text transfer protocol) :
•
des instructions HTML permettent de décrire une présentation (taille des caractères, couleurs,
polices) et d'intégrer des textes ou des images au document;
•
des liens hypertextes relient les éléments qui font référence à des adresses locales ou à des
adresses web.
Un site web se construit à l'aide de pages HTML rangées sur un serveur, accessibles par les
internautes et affichées par leurs navigateurs. Une page HTML est un texte (un script) qui peut être
écrit avec un simple traitement de texte. Toutefois, des utilitaires permettent de générer
graphiquement des pages HTML sans écrire directement le code HTML.
Avantages
Inconvénients
–
Interopérabilité entre navigateurs
–
–
Langage simple composé de balises
permettant de mettre en forme un
document produit avec n'importe quel
éditeur de texte brut et de conserver la
présentation générale d'un document
Nombreuses balises destinées à régler
davantage la présentation plutôt que le
contenu (ex. : <B> pour le gras, d> pour
l'italique, <TT> pour les polices à pas
fixe, etc.)
–
HTML non approprié à la description du
contenu
–
HTML pas assez flexible pour répondre à
l'immense variété des documents
candidats à la publication électronique
–
Structure distribuée (liens externes)
rendant difficile le stockage: risque de
perdre ou d'oublier un élément lié sans
s'en rendre compte
–
–
Standardisation des feuilles de style et
des cadres (trames) à partir de la version
4.0 du langage HTML
Gestion d'options multimédia
Les balises HTML
Les balises sont encadrées par < et >. Chaque balise d'ouverture est accompagnée d'une balise de
fermeture notée < / >.
Un document HTML débute par la balise <HTML> et se termine par </HTML>.
<TITLE>Présentation des balises HTML</TITLE> permet de définir le titre de la page HTML.
L'emboitement de balises est possible.
<B><I>Présentation des balises</I></B> affiche le texte concerné en italiques gras.
HTML permet de définir des liens hypertextes vers d'autres documents.
© Jacques Chambon
2/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
<HTML>
Déclaration d'un document HTML
<HEAD>
Déclaration de l'en tête de page Web
<META...>
Propriétés de la page ( nom de l'auteur,description, mots clé de la
page...)
<TITLE>
Titre de la page
<BODY>
Corps de la page
<IMG>
Insertion d'une image
<BR>
Passage à la ligne suivante (pas de balise de fermeture pour cette
action)
<B>
Caractère gras
<I>
Écriture en italique
<BIG>
Écriture en grands caractères
<FONT COLOR=#FF0000>
Couleur de police (ici couleur rouge définie par le code FF0000), La
couleur implicite est noire pour les textes courants.
<UL>
Permet de présenter une liste d'éléments (avec puce mais sans
numérotation).
<OL>
Permet de présenter une liste d'éléments numérotés
<LI>
Permet d'ajouter un élément à une liste
<FORM>
Délimite un formulaire à compléter en ligne par un internaute et
retourné au serveur Web
<A>
Lien hypertexte, Indiquer l'URL de destination grâce à HREF= "
autredocument.HTML " (le texte s'affiche implicitement en souligné)
Remarque :
Pour tester un code html, il est possible de l'écrire à l'aide d'un générateur de texte (comme Notepad
de Microsoft) puis de changer l'extension .txt du fichier par .html pour que le code soit ouvert et
exécuté à l'aide du navigateur internet disponible sur l'ordinateur.
Le langage XML
Le XML (Extensible Markup Language) est un langage à balises qui a pour objectif de décrire les
informations indépendamment de toute application. Le XML permet de transférer des données entre
des applications différentes.
Le XML est né du besoin de :
•
créer un standard d'échange universel simplifié mais puissant pour transporrter les données
sur le Web, mais aussi permettre à deux applications de dialooguer entre elles quel que soit
le langage ayant servi à leur développement et à leur environnement d'exécution;
•
structurer des documents complexes (séparation de la mise en page et du contenu) ;
•
définir précisément l'information contenue dans un document et aider à la recherche de ces
informations.
Contrairement au HTML, qui est à considérer comme un langage figé (avec un nombre de balises
limité), le XML est un métalangage de balisage, c'est-à-dire un langage permettant de créer des
langages de balises. Il permet d'inventer à volonté de nouvelles balises afin de mettre en relief la
structure logique d'un document et de faciliter l'accès direct aux données, aussi bien par l'être humain
que par les programmes informatiques dédiés.
Avantages
© Jacques Chambon
Limites
3/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
•
Flexibilité: il est possible de créer des
balises afin de répondre à des besoins
spécifiques.
•
Déployabilité : il peut être distribué par
n'importe quels protocoles à même de
transporter du texte, comme http.
•
Extensibilité: un document XML est
utilisable dans de nombreux domaines
d'application.
•
Structuration: le XML tient du SGML,un
respect très strict de la structure. Comme
le SGML, le XML dispose
d'une
structure.
•
Description: les éléments XML servent
exclusivement à décrire la signification
de leur contenu.
•
Facilité à apprendre tant au niveau de la
création de documents XML que de
l'écriture des programmes traitant les
documents XML.
•
Vulnérabilité des documents lors des
échanges sur un réseau non sécurisé
comme Internet car ils contiennent de
l'information sur leurs structurations, ce
qui facilite le travail d'interprétation des
malfaiteurs qui essaient d'y accéder
frauduleusement.
•
Les standards sécuritaires en vigueur
actuellement
pour
pallier
ces
inconvénients sont XML Signature et
XML Encryption.
•
Les signatures XML sont des signatures
numériques conçues pour être utilisées
dans les transactions XML.
•
La signature numérique obtenue par
chiffrement
permet
d'authentifier
l'émetteur d'un message et d'en vérifier
l'intégrité.
•
Le chiffrement/déchiffrement XML a pour
objectif de permettre le chiffrement de
(parties) de données XML échangées.
Pour ouvrir une étape consacrée au nom d'un client (Vial), on doit utiliser deux balises (l'une est
ouvrante et l'autre est fermante <nom_client>Vial</nom_client».
Les balises doivent notamment respecter les règles suivantes:
•
les noms des balises contiennent des lettres, chiffres ou autres caractères, ils ne peuvent ni
débuter par les lettres xml (majuscules ou minuscules), ni contenir d'espace ;
•
l'ouverture et la fermeture des balises doivent respecter l'arborescence du document;
•
les noms balises doivent être en cohérence avec les contenus.
Un document XML qui respecte toutes les contraintes syntaxiques est dit « bien formé» (dans le cas
contraire, on le dit « mal formé» ).
EXEMPLE
•.
Document XML bien formé: <corps_du_document> <titre>
<paragraphe>
Respecter l'ordre d'imbrication des balises </paragraphe>
</titre>
</corps_du_document>
Document XML bien formé: <corps_du_document> <titre>
© Jacques Chambon
4/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
<paragraphe>
Respecter l'ordre d'imbrication des balises </paragraphe>
</titre>
</corps_du_document>
<title>Dunod Editeur, édition de livres, Microsoft Press, ETSF, alsclence, rnter~dTt~<7lTtle::> Extrait
n° 2
<A H RE F= •• http://www.dunod.com/recherche-livre-collection-dunod.html •• >Collections<1 A>
Questions
1) Quelles sont les deux premières balises présentes sur ce code source? À quoi servent ces balises?
2) Quelles sont les balises permettant de présenter de litre du document source « Dunod Editeur,
édition de livres ... Il ?
3) Quel est le rôle de la balise <A HREF=" "> et <lA>?
CAS 12.2
Belass
l'association Belass, qui regroupe des joueurs de belote de votre commune, envisage de créer un site
Web. Pour tester la procédure d'hébergement par le fournisseur d'accès internet, vous décide de
créer une première page web très simple nommée Association BELASS et qui se présente ainsi
Association de joueurs de belote BELASS
• 128 rue des Dunes
• 56410 ETEL
• Téléphone: 02 97 10 10 10
Tournoi du mois d'avril en partenariat avec l'amicale laïque FADOR
L'association BELASS propose à ses adhérents de :
© Jacques Chambon
5/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
1. S'inscrire au tournoi en téléphonant à l'association BELASS
2. Se rendre sur le site de l'amicale laïque F ADOR pour les modalités
Cliquer ici pour accéder à l'amicale laïque du F AD OR
<:adt~:5317057Z0 lo<:aate:5 </commande entete> <xmLclient> <nom>Bergsson</Nom> <societe>
KRAFLA<$ociete>
<adresse_rue>9 rue des dunes</adresses_rue>
<ad resse _code_posta 1>44000</ ad resse_code_postal> <article>
<id entifia nt>0002 3 45</identifia nt> <designation>sac de couchage polaire</designation>
<quantite_valeur="lO" />
<prix_unitaire_ht="123,45" />
<commande>
Corrigé sur le site www.expert-sup.com
Ce chapitre introduit les principaux formats d'échange de docum posant une distinction entre format «
propriétaire» et format « Ol ensuite étudiés un format de présentation de documents (PDF) et à
balises (HTMl et XMl).
IIII Le langage à balises
La création de pages pouvant être lues par des navigateurs sur le réseau 1 net nécessite le recours
au HTML, qui est un langage à balises (markup) dc rôle est de formaliser l'écriture d'un document
grâce à des balises de forma Une balise est une suite de mots sans distinction entre majuscules et mi
cules entre <xx> (balise de début) et </xx> (balise de fin). La balise donnl informations de structure
ou de présentation à un texte qu'elle encadre p balise de début et la balise de fin. Elles permettent
d'indiquer la façon dont être présenté le document et les liens qu'il établit avec d'autres docum,
Toutefois, pour pallier les faiblesses du HTML présentées ci-après, un mét. gage à balises est né: le
XML (eXtensible Markup Language).
A. Le format HTML
1. La présentation du format HTML
Le HTML (HyperText Markup Language) est un langage de balisage stan utilisé pour les documents
sur Internet. Il est issu de la norme SGML (~ dardized Generalized Markup Language), qui définit des
© Jacques Chambon
6/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
langages de balisai a été mis au point par Tim Berners-Lee, chercheur, à partir de 1989. Toute ce
n'est qu'à partir de 1993 que l'on fait référence au langage HTML. Il é construit pour décrire les
documents hypertexte sur Internet. Le HTML e~ standard normalisé par le W3C (World Wide Web
Consortium - consor1 regroupant de nombreuses entreprises et organisations). La normalisa
Systèmes d'information de gestion
2. Les groupes de balises
Les balises peuvent être regroupées suivant leurs fonctions (tableau 12.2). Tableau 12.2 - Les
fonctions des groupes de balises
Groupe de balises Fonction
Balises de structure de document: <HTML>, Un document HTML est composé de trois
<HEAD>, <BASE>, <1SINDEX>, <META>, membres principaux: la déclaration HTML,
<BODY> l'en-tête (HEAD) et le corps (BODY).
Les balises de structure de document servent
à circonscrire ces membres.
Balises de formatage: <B>, <BASEFONT>, Les balises de formatage permettent de jouer
<BIG>, <FONT>, <1>, <BODY> sur la présentation du contenu.
Balises de liste: <LI>, <DIR>, <DL>, <DT>, Le HTML supporte cinq types de listes:
<DD>, <MENU>, <01>, <UL> -listes de définitions;
-listes répertoires;
-listes menus;
-listes numérotées;
-listes à puces.
Balises d'hyperliens : <A> Les hyperliens permettent de passer
d'un document HTML à un autre.
Balises d'images et d'imagemaps : Des éléments graphiques peuvent être
<1MG>, <MAP> et <AREA> insérés.
Balises de tableaux : Les tableaux HTML offrent un moyen clair
<TABLE>, <CAPTION>, etc. et net de présenter l'information. -.e-- définir précisément l'information contenue dans un document et aider à la
recherche de ces informations.
Contrairement au HTML, qui est à considérer comme un langage figé (avec un nombre de balises
limité), le XML est un métalangage de balisage, c'est-à-dire un langage permettant de créer des
langages de balises. Il permet d'inventer à volonté de nouvelles balises afin de mettre en relief la
structure logique d'un document et de faciliter l'accès direct aux données, aussi bien par l'être humain
que par les programmes informatiques dédiés.
© Jacques Chambon
7/8
22-COURS_SI_logiciel_Formats_Echange
Système d'information de Gestion
Tableau 12.4 - Avantages et limites du XML
Avantages Limites
- Flexibilité: il est possible de créer des - Vulnérabilité des documents lors des
balises afin de répondre à des besoins échanges sur un réseau non sécurisé
spécifiques. comme Internet car ils contiennent
- Déployabilité : il peut être distribué de l'information sur leurs structurations,
par n'importe quels protocoles à même ce qui facilite le travail d'interprétation
de transporter du texte, comme http. des malfaiteurs qui essaient d'y accéder
- Extensibilité: un document XML est frauduleusement.
utilisable dans de nombreux domaines - Les standards sécuritaires en vigueur
d'application. actuellement pour pallier ces inconvénients
- Structuration: le XML tient du SGML, sont XML Signature et XML Encryption.
un respect très strict de la structure. - Les signatures XML sont des signatures
Comme le SGML, le XML dispose numériques conçues pour être utilisées
d'une structure. dans les transactions XML.
- Description: les éléments XML servent - La signature numérique obtenue
exclusivement à décrire la signification par chiffrement permet d'authentifier
de leur contenu. l'émetteur d'un message et d'en vérifier
- Facilité à apprendre tant au niveau l'intégrité.
de la création de documents XML que - Le chiffrement/déchiffrement XML a pour
de l'écriture des programmes traitant objectif de permettre le chiffrement
les documents XML. de (parties) de données XML échangées.
Les formats d'échange
Format PDF
Le Portable Document Format (PDF), est un format de fichier informatique créé par Adobe Systems
Le format PDF préserve les polices, les images, les objets graphiques et la mise en forme de tout
document source, quelles que soient l'application et la plate-forme utilisées pour le lire.
Le format PDF peut aussi être interactif : il est en effet possible d'incorporer des champs de textes,
des notes, des corrections, des menus déroulant, des choix, des calculs, etc. On parle alors de
formulaire PDF.
C'est pourquoi ce format est utilisé dans un ensemble large et varié de logiciels, de l'exportation dans
les suites bureautiques grand public, aux manipulations par des programmes spécialisés de l'industrie
artistique.
Les fichiers PDF peuvent être créés avec des options personnalisées, tant aux niveaux de la
compression des images et des textes, de la qualité d'impression du fichier, que du verrouillage
(interdiction d'impression, de modification…).
Le PDF s'est imposé comme format d'échange (consultation écran, impression, etc...) et d'archivage
de documents électroniques.
© Jacques Chambon
8/8
22-COURS_SI_logiciel_Formats_Echange