Le media asset management à la croisée des

Transcription

Le media asset management à la croisée des
DOSSIER
MEDIA ASSET MANAGEMENT
Le media asset management
à la croisée des chemins
Cessation ou réorientations d'activités, fusions, nouveaux projets, nouvelles alliances… Le media asset management
(MAM) présentait un paysage contrasté et l'année prochaine s'annonce cruciale pour son développement.
D
isparition de SHS, absence de
certains acteurs américains
qui comme Convera, se sont
apparemment recentrés sur le marché informatique traditionnel, préférant participer au Seybold de San
Francisco, rachat de Virage par Autonomy… Le secteur du MAM, présentait d'un côté des signes inquiétants d'essoufflement. Pour Jeff
Karnes de Virage, le MAM est encore plus un concept qu’un marché.
Lancé il y a plus de quatre ans (le
premier article que Sonovision lui a
consacré date de 1999), le MAM
peine à s’imposer après la première
phase et les discours enthousiastes
des pionniers. Ce que confirme un
regroupement professionnel d'utilisateurs et d'industriels au sein du
G-SAM (Global Society for Asset Management) dont le chapitre européen a été créé lors de l'IBC.
Sur son site Web (www.g-sam.org),
un document pointe les difficultés :
promesses non tenues des vendeurs,
solutions conçues pour des applications de niche, à la taille d’un service, ne s'adaptant que difficilement
à une organisation entière, complexité, intégration à l'existant laissée principalement à la charge des
utilisateurs, retours sur investissements aléatoires, standards non stabilisés… mais aussi les bénéfices que
ceux qui ont su intégrer le MAM à
leur chaîne de traitement peuvent
constater en termes d'amélioration
des rendements.
L'IBC montrait aussi cet autre visage prometteur. Les consolidations
sont aussi facteur de dynamisme.
L'engagement renforcé d'Autonomy
illustre clairement la maturité crois-
sante du secteur, de même que la récente décision de Technicolor, filiale de Thomson, d'offrir un service de
MAM fondé sur les solutions d'IBM
basées sur Ancept à ses utilisateurs
américains. Et surtout, l'IBC fut l'occasion de présenter des innovations techniques et de nouveaux
produits.
Le « Speech to Text » se déploie
Confirmant une tendance amorcée
l'an passé, les solutions de recherche
fondées sur la reconnaissance vocale constituaient la grande avancée
de cette édition 2003. La transformation de la parole en fichier texte,
avec un taux de reconnaissance
élevé sans apprentissage préalable,
permet ensuite de déployer des stratégies d'indexation et de recherche
plein texte fondées sur des procédés classiques mais aussi sur de nouvelles approches sémantiques. Elle
promet, pour la recherche audiovisuelle, la puissance et la simplicité
de ce que Google a offert pour le
Web. Au total, les solutions gagnent
autant en automatisation des processus qu’en souplesse et flexibilité
pour les utilisateurs.
Outre Autonomy, qui y voit là l'occasion de déployer toute l’efficacité de ses propres mécanismes de
Virage
Dans le cadre de son rachat par Autonomy, « Virage restera une marque identifiée » nous a déclaré lors
d’une interview Jeff Karnes, directeur product marketing de la société. Virage bénéficiera désormais de la
technologie IDOL (Intelligent Data Operating Layer) adaptée à la gestion des données non structurées. Les
technologies Open Source de Virage devraient s’intégrer sans difficulté aux solutions d’Autonomy.
D’ores et déjà, le SmartEncode de Virage intègre la technologie de reconnaissance de la parole de Dremedia,
ancienne filiale spécialisée d’Autonomy. Le moteur de recherche, Verity, utilisé auparavant par Virage est
remplacé par la technologie de recherche sémantique d’Autonomy. D’autres développements sont attendus.
Estimant avoir relativement réussi jusqu’à présent dans un marché toujours en devenir, Virage, grâce aux
solutions d’Autonomy, misera à l’avenir davantage sur l’automatisation de la création des métadonnées
qui apparaît à Jeff Karnes comme la « clé du succès ».
SONOVISION • 66 • N ° 4 7 8 - N O V E M B R E 2 0 0 3
recherche, Artsum, Kinomai et Dalet
proposaient de tels dispositifs. Dalet
a d’ailleurs reçu le What Caught My
Ear Award pour sa solution ATE, Automatic Transcription Engine, disponible en Anglais, Arabe et Chinois
et bientôt en Français, Espagnol et
Allemand.
Au-delà de l'amélioration générale
des dispositifs, certains aspects
techniques demeurent encore en
attente d'évolutions, comme par
exemple, la prise en compte native
du nouveau format d'échange MXF.
Une belle présence française
Le salon a été l'occasion de présenter de nouvelles versions des produits existants. Arkemedia proposait la version 2 de sa solution comportant des mécanismes de sécurité renforcés. L'allemand Blue Order,
dont Mikros Image a adopté la solution Media Workbench, mettait
l'accent sur de nouvelles possibilités de montage à partir des versions
basse résolution et sur l'amélioration de la gestion du workflow de
son Media Archive. Snell & Wilcox
proposait des solutions d’ingest.
Les sociétés françaises occupaient
une place remarquée. Pour la première fois, SGT était présent avec
son Media Manager afin de répondre
à ce qu'elle perçoit comme une forte
demande du marché. Artsum, dont
70 % du CA est réalisé à l'étranger,
présentait la version 4 de Ecostream
et BitNicMM, intégrant des modules
de Kinomai afin d'offrir une chaîne
complète d’exploration des contenus (Media Mining). L'approche
d'Artsum, très orientée métier et visant notamment le secteur du
media monitoring, ne cherche pas
à remplacer les opérateurs humains mais à les aider à mieux accomplir leurs tâches.
Dalet faisait la démonstration de la
version 1.4 de DaletPlus, gérant les
vidéos proxy et permettant le partage de chûtiers (fonction clip bin).
L'outil peut être décliné selon des
versions packagées en fonction des
activités (news, médiathèque, archives).
Kinomai, forte de son accord de distribution des outils d'indexation vocale de Sail Labs, exposait ses solutions d'analyse intelligente de la
L’appliance BitNICMM conçue par Artsum permet l’exploration des contenus.
vidéo, permettant d’extraire, de segmenter et de comparer des séquences : K-Detect et K-Track v 2.0,
K-Archives, et K-Navigator v 1.0, l’un
des premiers outils de navigation rapide à supporter le Mpeg-7. Kinomai
présentait aussi un prototype de
portage de ces approches sur PVR.
Manreo insistait également sur les
enrichissements apportés à ses solutions pour mieux coller aux besoins du métier et aux tâches en proposant plusieurs desktops préparamétrés (annotation, segmentation,
métadonnées, personnel) et en présentant la version 2.0 de Hypercast
Editor, outil de dérushage et d’annotation des rushes. À cela, il faut
encore ajouter les développements
que Question d'Image réalise pour
la solution Invenio de Harris. Une
forte présence française innovante
qui mérite d’être particulièrement
soulignée en ces temps de doute.
Globalement plutôt optimistes, les
acteurs présents font confiance au
travail préalable d’éducation de la
demande mené depuis deux ans et
se montrent sereins quant à l’évolution du secteur. Un point de vue
partagé semble-t-il par les organisateurs de l’IBC qui avaient retenu
comme nouveau slogan « Content :
creation, management, delivery », intégrant explicitement pour la première fois cette notion de gestion.
Luis Estrada, responsable de ce secteur pour IBM, résumera la situation
en notant que le MAM est aujourd’hui dans la situation où se trouvaient les progiciels de gestion il y
a quinze ans, lorsque chaque acteur
faisait ses propres développements
propriétaires. Standardisation et
concentrations sont décidément à
l’ordre du jour.
Traitement de l'information audio/vidéo
Des sociétés en Europe telles que Kinomaï, Nextamp, LTU, ou Sail Labs
Technologies, proposent des solutions d'exploration des contenus
(Media Mining) qui permettent de structurer automatiquement le son
et l’image. La société Artsum a présenté à l'occasion de l'IBC 2003
certaines de ces technologies intégrées à son appliance BitNIC.
Le BitNICMM (MM pour Media Mining) est aussi doté de la technologie
de reconnaissance de phonèmes (conjuguée à une analyse sémantique)
développée par Sail Labs, permettant de transcrire automatiquement
la voix en texte dans de nombreuses langues, et ceci sans apprentissage
préalable. Les opérateurs peuvent ainsi accéder directement
à l'information recherchée et archivée en interrogeant les
moteurs textuels ou d'images.
Autre outil facilitant la navigation dans les contenus enregistrés, les
données transportées dans la vidéo elle-même. En association avec les
solutions de traçage de contenus de Nextamp, une spin-off du groupe
Thalès, les métadonnées créées à l'enregistrement vont s'enrichir
automatiquement des informations contenues dans un tatouage
invisible au cœur de chaque image (watermark). Ces données cachées
sont présentes en numérique, en Mpeg et en analogique. Elles auront
pu être insérées à l'origine avec un équipement tatoueur Nextamp
par le producteur, le distributeur ou en ingest par le diffuseur.
Le watermark peut par exemple indiquer la référence d'un reportage,
le contrat de diffusion d'un film, la version d'un spot publicitaire,
le numéro d'un épisode d'une série, le time-code d'origine d'un extrait
d'événement sportif, etc.
Alain Chaptal
SONOVISION • 67 • N ° 4 7 8 - N O V E M B R E 2 0 0 3