Le media asset management à la croisée des
Transcription
Le media asset management à la croisée des
DOSSIER MEDIA ASSET MANAGEMENT Le media asset management à la croisée des chemins Cessation ou réorientations d'activités, fusions, nouveaux projets, nouvelles alliances… Le media asset management (MAM) présentait un paysage contrasté et l'année prochaine s'annonce cruciale pour son développement. D isparition de SHS, absence de certains acteurs américains qui comme Convera, se sont apparemment recentrés sur le marché informatique traditionnel, préférant participer au Seybold de San Francisco, rachat de Virage par Autonomy… Le secteur du MAM, présentait d'un côté des signes inquiétants d'essoufflement. Pour Jeff Karnes de Virage, le MAM est encore plus un concept qu’un marché. Lancé il y a plus de quatre ans (le premier article que Sonovision lui a consacré date de 1999), le MAM peine à s’imposer après la première phase et les discours enthousiastes des pionniers. Ce que confirme un regroupement professionnel d'utilisateurs et d'industriels au sein du G-SAM (Global Society for Asset Management) dont le chapitre européen a été créé lors de l'IBC. Sur son site Web (www.g-sam.org), un document pointe les difficultés : promesses non tenues des vendeurs, solutions conçues pour des applications de niche, à la taille d’un service, ne s'adaptant que difficilement à une organisation entière, complexité, intégration à l'existant laissée principalement à la charge des utilisateurs, retours sur investissements aléatoires, standards non stabilisés… mais aussi les bénéfices que ceux qui ont su intégrer le MAM à leur chaîne de traitement peuvent constater en termes d'amélioration des rendements. L'IBC montrait aussi cet autre visage prometteur. Les consolidations sont aussi facteur de dynamisme. L'engagement renforcé d'Autonomy illustre clairement la maturité crois- sante du secteur, de même que la récente décision de Technicolor, filiale de Thomson, d'offrir un service de MAM fondé sur les solutions d'IBM basées sur Ancept à ses utilisateurs américains. Et surtout, l'IBC fut l'occasion de présenter des innovations techniques et de nouveaux produits. Le « Speech to Text » se déploie Confirmant une tendance amorcée l'an passé, les solutions de recherche fondées sur la reconnaissance vocale constituaient la grande avancée de cette édition 2003. La transformation de la parole en fichier texte, avec un taux de reconnaissance élevé sans apprentissage préalable, permet ensuite de déployer des stratégies d'indexation et de recherche plein texte fondées sur des procédés classiques mais aussi sur de nouvelles approches sémantiques. Elle promet, pour la recherche audiovisuelle, la puissance et la simplicité de ce que Google a offert pour le Web. Au total, les solutions gagnent autant en automatisation des processus qu’en souplesse et flexibilité pour les utilisateurs. Outre Autonomy, qui y voit là l'occasion de déployer toute l’efficacité de ses propres mécanismes de Virage Dans le cadre de son rachat par Autonomy, « Virage restera une marque identifiée » nous a déclaré lors d’une interview Jeff Karnes, directeur product marketing de la société. Virage bénéficiera désormais de la technologie IDOL (Intelligent Data Operating Layer) adaptée à la gestion des données non structurées. Les technologies Open Source de Virage devraient s’intégrer sans difficulté aux solutions d’Autonomy. D’ores et déjà, le SmartEncode de Virage intègre la technologie de reconnaissance de la parole de Dremedia, ancienne filiale spécialisée d’Autonomy. Le moteur de recherche, Verity, utilisé auparavant par Virage est remplacé par la technologie de recherche sémantique d’Autonomy. D’autres développements sont attendus. Estimant avoir relativement réussi jusqu’à présent dans un marché toujours en devenir, Virage, grâce aux solutions d’Autonomy, misera à l’avenir davantage sur l’automatisation de la création des métadonnées qui apparaît à Jeff Karnes comme la « clé du succès ». SONOVISION • 66 • N ° 4 7 8 - N O V E M B R E 2 0 0 3 recherche, Artsum, Kinomai et Dalet proposaient de tels dispositifs. Dalet a d’ailleurs reçu le What Caught My Ear Award pour sa solution ATE, Automatic Transcription Engine, disponible en Anglais, Arabe et Chinois et bientôt en Français, Espagnol et Allemand. Au-delà de l'amélioration générale des dispositifs, certains aspects techniques demeurent encore en attente d'évolutions, comme par exemple, la prise en compte native du nouveau format d'échange MXF. Une belle présence française Le salon a été l'occasion de présenter de nouvelles versions des produits existants. Arkemedia proposait la version 2 de sa solution comportant des mécanismes de sécurité renforcés. L'allemand Blue Order, dont Mikros Image a adopté la solution Media Workbench, mettait l'accent sur de nouvelles possibilités de montage à partir des versions basse résolution et sur l'amélioration de la gestion du workflow de son Media Archive. Snell & Wilcox proposait des solutions d’ingest. Les sociétés françaises occupaient une place remarquée. Pour la première fois, SGT était présent avec son Media Manager afin de répondre à ce qu'elle perçoit comme une forte demande du marché. Artsum, dont 70 % du CA est réalisé à l'étranger, présentait la version 4 de Ecostream et BitNicMM, intégrant des modules de Kinomai afin d'offrir une chaîne complète d’exploration des contenus (Media Mining). L'approche d'Artsum, très orientée métier et visant notamment le secteur du media monitoring, ne cherche pas à remplacer les opérateurs humains mais à les aider à mieux accomplir leurs tâches. Dalet faisait la démonstration de la version 1.4 de DaletPlus, gérant les vidéos proxy et permettant le partage de chûtiers (fonction clip bin). L'outil peut être décliné selon des versions packagées en fonction des activités (news, médiathèque, archives). Kinomai, forte de son accord de distribution des outils d'indexation vocale de Sail Labs, exposait ses solutions d'analyse intelligente de la L’appliance BitNICMM conçue par Artsum permet l’exploration des contenus. vidéo, permettant d’extraire, de segmenter et de comparer des séquences : K-Detect et K-Track v 2.0, K-Archives, et K-Navigator v 1.0, l’un des premiers outils de navigation rapide à supporter le Mpeg-7. Kinomai présentait aussi un prototype de portage de ces approches sur PVR. Manreo insistait également sur les enrichissements apportés à ses solutions pour mieux coller aux besoins du métier et aux tâches en proposant plusieurs desktops préparamétrés (annotation, segmentation, métadonnées, personnel) et en présentant la version 2.0 de Hypercast Editor, outil de dérushage et d’annotation des rushes. À cela, il faut encore ajouter les développements que Question d'Image réalise pour la solution Invenio de Harris. Une forte présence française innovante qui mérite d’être particulièrement soulignée en ces temps de doute. Globalement plutôt optimistes, les acteurs présents font confiance au travail préalable d’éducation de la demande mené depuis deux ans et se montrent sereins quant à l’évolution du secteur. Un point de vue partagé semble-t-il par les organisateurs de l’IBC qui avaient retenu comme nouveau slogan « Content : creation, management, delivery », intégrant explicitement pour la première fois cette notion de gestion. Luis Estrada, responsable de ce secteur pour IBM, résumera la situation en notant que le MAM est aujourd’hui dans la situation où se trouvaient les progiciels de gestion il y a quinze ans, lorsque chaque acteur faisait ses propres développements propriétaires. Standardisation et concentrations sont décidément à l’ordre du jour. Traitement de l'information audio/vidéo Des sociétés en Europe telles que Kinomaï, Nextamp, LTU, ou Sail Labs Technologies, proposent des solutions d'exploration des contenus (Media Mining) qui permettent de structurer automatiquement le son et l’image. La société Artsum a présenté à l'occasion de l'IBC 2003 certaines de ces technologies intégrées à son appliance BitNIC. Le BitNICMM (MM pour Media Mining) est aussi doté de la technologie de reconnaissance de phonèmes (conjuguée à une analyse sémantique) développée par Sail Labs, permettant de transcrire automatiquement la voix en texte dans de nombreuses langues, et ceci sans apprentissage préalable. Les opérateurs peuvent ainsi accéder directement à l'information recherchée et archivée en interrogeant les moteurs textuels ou d'images. Autre outil facilitant la navigation dans les contenus enregistrés, les données transportées dans la vidéo elle-même. En association avec les solutions de traçage de contenus de Nextamp, une spin-off du groupe Thalès, les métadonnées créées à l'enregistrement vont s'enrichir automatiquement des informations contenues dans un tatouage invisible au cœur de chaque image (watermark). Ces données cachées sont présentes en numérique, en Mpeg et en analogique. Elles auront pu être insérées à l'origine avec un équipement tatoueur Nextamp par le producteur, le distributeur ou en ingest par le diffuseur. Le watermark peut par exemple indiquer la référence d'un reportage, le contrat de diffusion d'un film, la version d'un spot publicitaire, le numéro d'un épisode d'une série, le time-code d'origine d'un extrait d'événement sportif, etc. Alain Chaptal SONOVISION • 67 • N ° 4 7 8 - N O V E M B R E 2 0 0 3