fr Introduction
Transcription
fr Introduction
fr Introduction Sommaire • 1 Comprendre Maarch Framework 3 • 2 Préparer • 3 Capturer • 4 Verser • 5 Organiser • 6 Communiquer • 7 Pour aller plus loin... Comprendre Maarch Framework 3 Maarch Framework 3 est une infrastructure de GED de Production, répondant en standard à la plupart des besoins de gestion opérationnelle de contenu d'une organisation. La très grande majorité des composants du Framework est disponible en licence GPLv3, c'est à dire en Open Source, de sorte que le coût d'implémentation rend la solution aborbable pour tout type d'organisation (public, privé, parapublic, monde associatif). Pour autant, Maarch ayant été conçu par deux consultants cumulant à eux deux plus de 20 ans d'expertise en Systèmes d'Archivage Électronique et en Éditique, le produit offre toutes les garanties de robustesse, d'intégrité, de performance que l'on doit attendre de ce type de produit. Un grand soin a été porté sur l'architecture afin d'autoriser des performances maximales sur du matériel standard. Maarch est entièrement développé en PHP5 Objet. Il est compatible avec les 4 moteurs de bases de données suivants : MySQL, PostgreSQL, SQLServer, et bientôt Oracle. Maarch est totalement modulaire : toutes les fonctionnalités sont regroupées dans des modules exposant des services qui peuvent être activés/désactivés en fonction du profil de l'utilisateur. Un ingénieur expérimenté peut ajouter ou remplacer un module existant sans toucher au c?ur du système. Maarch propose un schéma global et tous les outils pour acquérir, gérer, conserver puis restituer les flux documentaires de production. C'est à notre connaissance la seule offre globale Open Source proposant autant de fonctionnalités en standard. Regardons de près ce que Maarch peut faire pour vous : Préparer Maarch permet de préparer les versements dans l'archive, grâce au module Physical Archive. Le module dispose de fonctionnalités d'impressions de séparateurs code-barre, reprenant l'identité du dossier à numériser, le type de document, et la boite d'archivage dans lequel viendra se placer le dossier physique après la numérisation. Les lots sont créés à priori dans le logiciel pour une traçabilité optimale. Les séparateurs code-barre sont positionnés sur la pile de feuilles afin d'identifier et de séparer les documents pendant la numérisation de masse. Le système gère aussi plusieurs types de lots : on peut choisir l'écran de saisie et d'impression de l'étiquette adapté au type de document à numériser. Le module est intégré dans l'application d'exemple : Travail sur les dossiers de crédit Pour gérer le versement en archivage physique de la boite, nous sortirons bientôt un module d'archivage physique avancé, reprenant en Open Source toutes les caractéristiques attendues d'un logiciel de gestion des archives physiques : • Gestion des unités de conditionnement (boites, cartons, volume occupé) • Gestion des emplacements de stockage multi entrepôt (création et attribution d'espace) • Gestion des prêts et restitutions • Edition des bordereaux de versement, édition des fiches fantôme • etc. Ce module est réalisé avec l'aide de Marc Créhange, Consultant en archives physiques, et de Anne-Marie Bruleaux, responsable de la chaire d'archivistique de l'université de Mulhouse. Capturer Maarch dispose de plusieurs canaux d'acquisition des documents entrants : • Par référencement manuel d'un document électronique • Par conversion PDF à l'aide d'une imprimante virtuelle, de façon à constituer une photo électronique du document à archiver • Par numérisation directe sur le poste de travail à l'aide d'un scanner faible volume L'imprimante virtuelle Maarch et la numérisation directe sont des moyens très simples et intuitifs de procéder à l'acquisition : suite à la demande de versement, le document est présenté en PDF dans la partie droite de l'écran, alors que les champs de saisie des qualificateurs sont présentés à gauche. Pour en savoir plus : Dossier d'installation et d'exploitation des connecteurs Enfin, pour les projets de numérisation gros volumes, Maarch dispose d'un module "SAI" performant et innovant, autorisant la numérisation illimitée de documents. Ce module permet entre autre : • le transfert sécurisé via des protocoles internet du site de numérisation vers le site d'archivage. Lors du transfert, les documents sont découpés en paquets de 1024 octets, et sont complétés d'un CRC. Un protocole de transfert est établi entre le module client et le serveur, garantissant l'intégrité du document pour toutes les qualités de liaison. • le découpage du lot de numérisation en fonction des séparateurs code-barre, et la reconnaissance de leur contenu. Nous utilisons pour cela des librairies propriétaires ayant démontré une grande fiabilité dans la reconnaissance. • la conversion PDF des images • la préparation des lots d'importation pour Maarch AutoImport, avec toutes les informations de service liées à la numérisation, et indispensables pour la norme Z42-013. Une communication constante avec messages de retour est assurée entre le serveur et le module client : ainsi il est possible d'ajouter des contrôles personnalisés coté serveur, et d'avertir l'opérateur en cas de problème lié à la qualité de la numérisation (taille des pages, concordances des codes dossier, ruptures de séquence, etc.). Avec Maarch SAI, plus besoin de logiciels de pilotage de scanners lourds et chers : il suffit de numériser des lots en TIFF grâce aux logiciels gratuits fournis avec les scanners (Kodak Capture Software, Fujitsu ScandAll, ...). Il n'y a non plus aucune limitation concernant le nombre de pages. Maarch SAI ne peut être proposé en téléchargement libre à cause des librairies propriétaires utilisées. Par contre les sources sont disponibles auprès des intégrateurs Maarch afin d'implémenter des contrôles ou traitement spécifiques. Verser Les modules interactifs proposent la capture et le versement au sein du même processus. Pour les traitements de masse, Maarch AutoImport est le module autorisant le versement rapide de lots de ressources électroniques dans Maarch, que ce soit en sortie de numérisation ou de traitement Editique. Maarch AutoImport fournit aussi toutes les informations de service relatives au processus. Le module a été conçu pour traiter plusieurs dizaines de milliers de documents à l'heure. Pour en savoir plus : Maarch AutoImport : Guide d'installation et d'exploitation Organiser Les documents versés dans Maarch sont immédiatement disponibles en consultation, mais il existe des moyens d'organiser ces derniers pour les rendre plus pratiques à consulter et à manipuler. Maarch OCR convertit un PDF image en PDF image+texte (sous licence propriétaire), ou extrait le texte d'un PDF pour le mettre en pièce jointe au document (libre). La conversion d'une image en TIFF ou en PDF image se fait dans un module Maarch intégrant le moteur d'ABBYY, dont la réputation n'est plus à faire. On obtient alors des PDF Image et texte avec un taux de reconnaissance exceptionnel sur le dactylographié. L'OCR libre extrait simplement le texte de l'image. Il est basé sur implémentation du projet Open Source Tesseract sponsorisé par Google. Maarch Fulltext indexe les PDF image+texte ou le texte brut en plein texte. Ce module est basé sur le célèbre projet Open Source Lucène, dans son portage PHP effectué par Zend. L'utilisation combinée de Maarch OCR et Maarch Fulltext permet de procéder à des recherches floues directement dans le contenu du document numérisé. Maarch Autofoldering procède à une catégorisation automatique des documents sur la base de leur index. Après le passage de l'Autofoldering, l'utilisateur accède à l'archive grâce à des arbres de parcours. Communiquer Maarch garantit la conservation sécurisée du contenu versé, mais assure aussi la circulation et la restitution des documents, au travers de modules fonctionnels riches. La recherche des documents s'effectue dans le module Indexing & Searching grâce aux index fonctionnels paramétrables. En connectant le module Folders, il est possible de ranger les documents dans des dossiers structurés, et de procéder à des recherches sur les qualificateurs de dossier. La circulation des documents pour validation/rangement s'effectue à l'aide de bannettes (module Baskets) ou par workflow procédural (module Workflow). Enfin, Maarch CD est un outil permettant de graver un support autonome, comprenant les documents, les index, et l'interface de recherche et consultation. Le support est autoporté : le destinataire du support dispose d'une application Maarch de recherche, sans devoir faire d'installation. Maarch CD demande de l'intégration spécifique : comme il n'est pas raisonnable de mettre tout le framework sur le support amovible, le destinataire dispose d'une interface de consultation simplifiée correspondant à des besoins précis. Veuillez contacter Maarch pour les modalités d'utilisation de ce module. Pour aller plus loin... Pour avoir un aperçu des capacités de Maarch sur votre machine, il faut télécharger et installer le framework avec l'application d'exemple. Le Guide de démarrage rapide présente les fonctionnalités Maarch à la lumière du sample, puis vous guide dans son utilisation. Le chapitre Fonctionnalités offre une description en français des fonctions par module. La documentation en anglais du Guide du developpeur présente les procédures d'installation, de paramétrage, et la mécanique interne du coeur, de l'application, et des modules. Enfin, le schéma de la base de données utilisé par Maarch est inscrit dans les pages relatives au Modèle de données.