Etude du Manuel d`Indexation commun a tous les
Transcription
Etude du Manuel d`Indexation commun a tous les
Etude du Manuel d'Indexation commun a tous les documentalistes Raphael Troncy [email protected] 12 avril 2001 1 Introduction a caractere IndusL'INA (Institut National de l'Audiovisuel) est un Etablissement Public de l'Etat triel et Commercial (EPIC) dont la mission principale est de constituer le patrimoine de la television et de la radio francaise. Cette mission patrimoniale se decline en deux departements : { Le Departement Droits et Archives (DDA), heritier du fond des archives de l'ORTF, collecte les programmes des cha^nes de television et des radios publiques. Il les stocke et eventuellement les restaure, mais il doit avant tout en faciliter l'acces aux professionnels de l'audiovisuel. { L'Inatheque de France est chargee de la mise en uvre du Dep^ot Legal de la Radio-Television deni par la loi du 20 juin 1992. Ainsi, depuis le 1er janvier 1995, l'Inatheque recense l'integralite des programmes des diuseurs nationaux hertziens de television (soit six cha^nes) et ceux des cinq cha^nes nationales de Radio France. Par ailleurs, elle documente et conserve les programmes de production francaise. Chacun de ces deux departements doit donc gerer et archiver un ux documentaire entrant continu, c'est-a-dire selectionner et documenter une partie de ce ux. La selection suit un certain nombres de regles denies par l'institution. La documentation, elle, est eectuee par des documentalistes et concerne le catalogage et l'indexation des documents audiovisuels. La problematique de l'indexation concerne la creation et la constitution d'index pour permettre une recherche documentaire. La creation des index repose sur l'analyse ou l'interpretation du contenu du document de maniere a en degager les caracteristiques les plus representatives. Ces caracteristiques sont formulees dans un langage naturel contr^ole, specialement choisi ou concu pour faciliter la recherche. A l'INA, l'indexation des documents s'eectue a travers la redaction de notices documentaires contenant des champs contr^oles et des mots-cles inscrits dans un thesaurus dont on a normalise la semantique. Mais comme le souligne Bachimont dans [2], la vision consistant a assimiler l'indexation a une interpretation du contenu appelle les remarques suivantes : { l'indexation est une interpretation qui est soumise, d'une part, a la subjectivite de l'indexeur, dont on tente de surmonter la variabilite et, d'autre part, a la nalite de la consultation (pour qui indexe-t'on?) que l'on veut optimiser ; { l'indexation ne rend pas compte des proprietes intrinseques et objectives d'un document mais exprime un point de vue en fonction d'une application visee des documents (retrouver des documents, pour quoi faire?). Autrement dit, il n'existe pas d'indexation universelle ou d'indexation independante d'un contexte applicatif. A l'INA, la relativite de l'indexation est ma^trisee par un ensemble de regles et d'usages propres aux metiers des documentalistes qui contraint la description des documents. Il en resulte un manque de souplesse pour exprimer les index mais ceux-ci deviennent plus pertinents par rapport au contenu et a l'exploitation visee des documents. Ces regles et usages sont disponibles dans un manuel d'indexation [3], sorte de bible qui accompagne le travail des documentalistes. 1 Il est utile ici de preciser la specicite des deux cha^nes de television publiques (France2 et France3) et des radios publiques. En eet, ces diuseurs sont a la fois concernes par la mission du Departement Droits et Archives mais rentrent aussi dans le cadre du Dep^ot Legal. Theoriquement, les programmes issus de ces diuseurs devraient donc faire l'objet d'un double traitement documentaire donnant lieu a la redaction de deux notices. Cependant, la notice provenant de l'Inatheque etant plus complete, elle tend a ^etre hegemonique laissant au DDA la gestion des fonds anciens. Ce document a donc pour but de synthetiser les connaissances et regles contenues dans le manuel utilise par les documentalistes de l'Inatheque pour pouvoir ensuite les representer symboliquement via un formalisme de representation de connaissance. La base de connaissance ainsi formee permettra d'eectuer des manipulations formelles sur les descriptions tels que proposer des schemas de description ou d'en enrichir des existants. 2 Programme, emission, document : un cycle de vie documentaire 2.1 La grille de programmes La mission de l'Inatheque consiste a capter un ux hebdomadaire entrant de programmes, a decouper ce ux et a appliquer un traitement documentaire a chacune des entites le composant. Le systeme d'entree des donnees traitees est donc, pour chacun des diuseurs, une grille previsionnelle des elements diuses appelee grille des programmes. Cette grille permet de decrire la programmation d'une cha^ne de diusion pour une periode donnee (la semaine). C'est un objet deni par un nom et une date d'eet, et courant sur sept jours (Figure 1). Grille de Programmes - nom (ex : Grille des programmes de France 2) - date d'effet (ex : Semaine du 19/10/1998) - journée de diffusion cardinalité = 7 type = journée de programme Fig. 1 { Une representation objet de la grille de programmes La journee de programme est un ensemble de descriptifs de programmes appeles cases antenne. Tous les elements diuses font au moins l'objet d'une identication, qu'ils relevent ou non du Dep^ot Legal. A chaque case antenne correspond un element de programme (ELP) qui est l'unite materielle 1 . Mais le materiel (et donc l'ELP correspondant) n'equivaut pas systematiquement a une entite de programme. 2.2 Vers une unite de traitement documentaire Un des premiers problemes auxquels ont ete confrontes les documentalistes de l'Inatheque concerne l'unite de traitement documentaire a adopter, c'est-a-dire determiner l'entite minimale sur laquelle va porter le traitement. En eet, comme le montre Auret dans [1], avant de devenir un document, le contenu audiovisuel est un programme qui s'inscrit dans un cycle de vie documentaire. Ainsi, le producteur, le diuseur puis l'archive ne vont pas aborder les contenus de la m^eme facon, donnant lieu a autant d'unites de traitement documentaire possibles (Figure 2). Du point de vue de sa structure de production (ou encore structure propre ), le programme peut ^etre de structure simple (homogene) ou complexe, c'est-a-dire compose de un ou plusieurs elements autonomes. L'unite documentaire a associer pourrait donc ^etre le programme dans son integralite lorsqu'il est simple ou ses dierents elements lorsqu'il est composite. 1. Par materiel, on entend l'ensemble des supports verses ou recopies. A un ELP sont associes une ou plusieurs cassettes en fonction de la duree de l'ELP 2 Programme - Émission titre heure théorique de début et fin mode de diffusion périodicité sélection Dépôt Légal type de traitement type de description typologies est-un - est-un Structure simple Structure composite document de synthèse -document de synthèse -sujets de sommaire inclus Collection - titre - fiche mère Le programme selon sa structure de production Fig. titre heure théorique de début et fin mode de diffusion périodicité sélection Dépôt Légal type de traitement type de description typologies inclus Tranche horaire - titre - sujets de sommaire L'émission selon sa structure de diffusion 2 { La description du document a l'Inatheque : structure de production vs structure de diusion Du point de vue du diuseur, le programme entre dans une logique de programmation qui reete la politique editoriale de la cha^ne. Une nouvelle structure est donnee lors de sa diusion gr^ace a un habillage ou a des coupures publicitaires. On parle alors d'emission. Celle-ci peut appartenir a une tranche horaire caracterisee par une thematique recurrente ou encore a une collection regroupant un certain nombre d'emissions ayant en commun un titre, une thematique, une mise en forme et au moins un auteur et dont chaque numero est diusable independamment. Ici, le traitement documentaire peut donc s'eectuer au niveau de ces deux ((macro-entites )). Des lors qu'elle est archivee, l'emission devient un document pour lequel une notice documentaire est redigee. Les documentalistes ont decide de conserver ces dierents plans de structuration (production et diusion). La notice documentaire est donc hierarchisee et comprend deux niveaux : un document dit de ((synthese )) et des sujets de sommaire. { Le document de synthese sert a decrire un programme dans sa globalite. Les informations concernant l'unite sont reparties, par categorie, dans des zones formatees appelees champs. Il comprend : un titre, une heure theorique de debut et une heure theorique de n, le mode de diusion (direct, diere, duplex...), sa periodicite (quotidien, week-end, hebdomadaire, mensuel, annuel...), une mention precisant la selection Dep^ot Legal ou non, un type de traitement (section 2.3), un type de description (section 2.4) qui permet de preciser les notions de structure et d'inclusion, et des typologies (section 3). { Les sujets de sommaire permettent de decliner les dierents elements constituant le programme. Selon sa structure propre, il s'agira des elements composant le sommaire d'une emission composite 2 ou d'une tranche horaire 3. Selon sa structure de diusion, il s'agira de referencer les interprogrammes 4, les elements d'habillage de l'emission (sequences de presentation ou de lancement, sequences de conclusion) ou encore les ruptures dues a un incident technique. Depuis peu, les sujets de sommaire contiennent eux-aussi des champs precisant un type de traitement (section 2.3), un type de description (section 2.4) et des typologies (section 3). Enn, la collection fait aussi l'objet d'une notice documentaire appelee che mere. Elle n'est pas le resultat de l'addition des contenus de toutes les emissions mais s'attache a la description de ses constantes thematiques et formelles, de la scenographie ou encore du dispositif technique mis en place. 2. Emission caracterisee par l'emploi successif d'elements autonomes par leur forme et leur contenu (ex : plateau, reportage et entretien d'un magazine) 3. La tranche horaire est en fait vue comme un type particulier d'emission composite 4. Tout ce qui constitue l'habillage d'une cha^ne : bandes annonces, espaces publicitaires, jingles... 3 2.3 Les types de traitement Un document audiovisuel peut donc ^etre observe a des niveaux dierents : la collection, l'emission ou les elements de l'emission. De la m^eme facon, il peut ^etre vu sous des angles dierents (d'une simple identication a une description precise du contenu et de la mise en forme), a partir de sources multiples (visionnage ou ecoute, documentation d'accompagnement fournie par le producteur, le diuseur ou la presse specialisee encore appelee peri-documentation ). Le traitement documentaire doit tenir compte de l'economie generale du secteur concerne (le public vise et ses demandes, le volume des documents conserves, le systeme de donnees) et respecter un equilibre de traitement entre les dierents genres audiovisuels. Ces deux facteurs ont conduit a faire les choix suivants : { une description approfondie des collections et des ensembles : cette option permet de limiter le traitement de chaque emission appartenant a un ensemble a ses particularites propres ; { un traitement documentaire dierencie par type d'emission, le choix du niveau de traitement etant lie a la richesse et a l'originalite de l'information ; { une utilisation denie des dierentes sources d'information en fonction de leur importance respective et du niveau de traitement selectionne. Cette dierenciation de traitement documentaire est materialisee en pratique par six niveaux de description : (ici, classe par ordre croissant d'information) { L'identication concerne les documents non selectionnes dep^ot legal, les rediusions et les interprogrammes. Elle comprend pour l'essentiel des informations sur la programmation (cha^ne, jour calendaire, horaire, duree), les titres, les societes de production et les typologies. { Le catalogage signaletique recense les elements objectifs de l'emission : generique, structure de decoupage, thematique generale. Ainsi, il comprend en plus de l'identication les auteurs, presentateurs, interpretes et participants principaux, et un decoupage de l'emission en sujets de sommaire si celui-ci est explicitement identie sur les sources papiers. { Le catalogage analytique repond aux questions suivantes : qui parle ? [a qui ?] de quoi ? ou ? quand ? dans quel ordre ? Il comprend, en plus du catalogage signaletique, un resume redige par le documentaliste a partir de la documentation papier fournie par le diuseur et/ou d'un visionnage partiel. { Le catalogage synthetique est une variante simpliee du catalogage analytique dont il se distingue par une absence systematique de resume chronologique. Mais il comprend, en plus du catalogage signaletique, le generique complementaire, un resume du producteur et des descripteurs principaux repondant a ((ou, de quoi, et quand )). { L'indexation du contenu ajoute au catalogage la transcription du contenu sous forme synthetique. Contrairement au catalogage, elle implique une part d'interpretation du documentaliste. Le principal apport concerne un resume en langage libre mais qui se tient au plus pres du vocabulaire du document lui-m^eme et un choix de mots cles utilises comme descripteurs explicites. { L'indexation formelle, plus particulierement utilisee dans les ches collection, est centree sur la description des constantes structurelles et formelles du document comme l'organisation et le deroulement des interventions, les dispositifs techniques, le decor, la lumiere, le rythme de montage ou encore l'utilisation de la musique. Il existe deux sources principales d'information pour les descriptions, utilisees seules ou en combinaison : { le visionnage ou l'ecoute des documents (complet, partiel ou occasionnel) ; { la documentation ecrite. En regle generale, la documentation papier est la premiere entree. En fonction de son importance et du niveau de traitement prevu, elle peut ^etre completee par un visionnage ou une ecoute. 4 2.4 Les types de description Comme nous l'avons deja vu, une emission peut ^etre de structure simple ou complexe ou encore appartenir a un ensemble (appelee collection ). Le type de description permet justement de preciser le mode de diusion de l'entite et sa structure propre. Pour cela, seize codes recensent les choix possibles : { Les ches collection { 10 : collection d'emissions simples chaque numero (ou emission) est diusable isolement et a une structure de production homogene ; { 20 : collection de tranche horaire ; { 30 : collection d'emissions composites chaque numero (ou emission) est diusable isolement et a une structure composite ; { 40 : emission en plusieurs episodes ou parties suite a episodes ouverts (feuilleton, emission a suite). { Les notices documentaires { 11 : emission simple emission isolee ou appartenant a une collection a structure de production simple ; { 21 : tranche horaire ; { 31 : emission composite emission isolee ou appartenant a une collection a structure de production composite ; { 41 : episode ou partie d'un videogramme partie, episode... appartenant a une suite fermee, a episodes ouverts ; { 61 : journee temoin ; { 71 : interprogramme. { Les notices documentaires de programmes inclus (dans une tranche horaire ou une emission) { 12 : emission simple incluse ; { 22 : tranche horaire incluse ; { 32 : emission composite incluse ; { 42 : episode ou partie d'un videogramme inclus ; { 52 : sujet de sommaire ; { 72 : interprogramme inclus. Le type de description permet donc de recenser les regles de decoupage des programmes. Il determine aussi le niveau de traitement documentaire qu'on va leurs associer. Il restreint donc les champs qui vont ^etre values. De plus, l'Inatheque a developpe une typologie des documents an d'associer un traitement documentaire selon leurs genres. L'etude de cette typologie est l'objet de la section suivante. ) ) ) ) ) ) 3 La typologie des documents Pour caracteriser une emission dans sa globalite ou alors l'une de ses parties (qui fait l'objet d'un sujet de sommaire), l'INA utilise un vocabulaire formalise ou typologie. Les typologies font l'objet de plusieurs listes d'autorite : { la typologie Mediametrie (section 3.1) ; { la typologie INA basee sur des genres, des themes et des publics (section 3.2). 3.1 La typologie Mediametrie Cette typologie est caracterisee par une liste de termes pre-coordonnes et hierarchises. Par exemple, les Figures 3 et 4 montrent les branches de l'arbre correspondant respectivement aux emissions de type ction et sport. Ainsi, le code ACA indique que l'on a un programme de type ction, serie, policiere 5 (par exemple : Navarro ) tandis que le code FBM specie un type sport, magazine, multisports (par exemple : Stade 2 ). Chaque terme est donc une expression qui s'utilise seule. En fait, cette typologie est fortement liee a l'usage des publicitaires puisque son objectif est de fournir une classication toujours plus precise aux diuseurs et aux annonceurs. Elle est donc adapte au type de description dep^ot legal fonde sur la programmation mais l'est beaucoup moins d'un point de vue archives. Cette typologie ne represente qu'un champ supplementaire dans les notices, non ma^trise car les documentalistes recopient la valeur donnee par Mediametrie. 3.2 La typologie INA La typologie INA est un systeme a facettes compose de plusieurs listes : des genres, des themes et des publics. Chaque liste comporte un nombre restreint de termes. Les emissions sont caracterisees par des combinaisons de valeurs mais globalement, la typologie qui en resulte est moins raÆnee que celle provenant de Mediametrie. Ce choix de depart presente comme avantage une grande souplesse liee a la capacite a prendre en compte des genres nouveaux en raison de la multiplicite des combinaisons possibles. L'inconvenient majeur vient du fait qu'il est impossible de hierarchiser ces combinaisons. Cependant, c'est cette typologie qui est fortement utilisee et qui va conditionner les descriptions documentaires a produire. Nous la detaillons donc par la suite. Les genres Ils caracterisent, en regle generale, la forme audiovisuelle de l'emission. Cependant, certaines valeurs codent egalement le mode de diusion (retransmission ) ou de realisation (realisation TV dans un lieu public ), le statut de l'objet diuse (creation televisuelle ), un type de programmation (tranche horaire ), l'appartenance a un ensemble (serie ), le media d'origine (long metrage ou telelm )... Le Tableau 1 enumere l'ensemble des genres possibles pour la television. Libelle Adaptation Animation Bande annonce Best of Breve Comedie de situation Conference de presse Cours d'enseignement Court metrage Creation televisuelle Debat Declaration Documentaire Entretien, Interview Extrait Libelle Feuilleton Interlude Jeu Journal televise Journee temoin Long metrage Magazine Message info Message publicitaire Micro-trottoir Mini-programme Montage d'archives Oeuvre enregistree en studio Plateau en situation Presse lmee Libelle Programme a base de clips Programme atypique Realisation dans un lieu public Reality show Recit, Portrait Reportage Retransmission Retrospective Revue de presse Serie Spectacle TV Telelm Temoignage Tranche horaire Videoclip 1 { Les genres possibles pour la television. Les genres creation originale et telefilm court ne sont plus utilises Tab. Actuellement, l'usage contraint toute description a posseder au moins un genre et au plus quatre pour les documents de synthese et au plus deux pour les sujets de sommaire. Par convention, le premier terme entre est le terme le plus general dans la mesure ou il caracterise l'objet decrit lui-m^eme et non son environnement. Par exemple, telelm et serie indique une ction d'une duree superieure a 52 minutes diuse dans le cadre d'une serie. 6 7 Fig. 3 { Branche de l'arbre correspondant aux emissions de type ction ; le code ACA designe par exemple une emission de type fiction, serie, policiere Fiction : A Long métrage : A - Comédie : A - Policier, Espionnage, Suspense : B - Aventure : C - SF, Fantastique : D -X:E - Drame psychologique, Comédie dramatique : F - Guerre : G - Western : H - Historique : I - Erotique : J - Faits de société : K - Film musical ou Comédie musicale : L - Animation : M - Documentaire : N Téléfilm : B - Comédie : A - Policier, Espionnage, Suspense : B - Aventure : C - SF, Fantastique : D -X:E - Drame psychologique, Comédie dramatique : F - Guerre : G - Western : H - Historique : I - Erotique : J - Faits de société : K - Comédie musicale : L - Documentaire : N Série : C - Policière : A - Humoristique : B - Autre : C - Feuilleton : D - Théâtre : E - Court métrage : F - Dessin animé : G - Animation : H 8 Fig. 4 { Branche de l'arbre correspondant aux emissions de type sport ; le code FBM designe par exemple une emission de type sport, magazine, multisports Sport : F Retransmission : A - Football : A - Rugby : B - Tennis : C - Sport neige, glace : D - Cyclisme : E - Golf : F - Sports mécaniques : G - Athlétisme : H - Sports équestres : I - Sports de combat : J - Corrida : K - Coulisses : L - Autre sport : M Magazine : B - Football : A - Rugby : B - Tennis : C - Sport neige, glace : D - Cyclisme : E - Golf : F - Sports mécaniques : G - Athlétisme : H - Sports équestres : I - Sports de combat : J - Corrida : K - Autre sport : L - Multisports : M - Magazine mixte : C - Pronostic : D Jeux Olympiques : E - Hiver : A - Eté : B Les thematiques Une seconde liste de termes permet de caracteriser la thematique generale consideree sous l'un ou l'autre des angles suivants : { le contenu proprement parle de l'emission c'est-a-dire ce dont on parle ; { son type, c'est-a-dire la reference du domaine dans laquelle elle s'inscrit (spectacle, sciences, information, vie quotidienne...). Il y a une exception a ce double usage : cinema n'est utilise que pour qualier le contenu. En eet, le deuxieme sens est, en general, implicite : un long metrage est necessairement cinematographique. Le Tableau 2 enumere l'ensemble des themes possibles pour la television. Libelle Spectacle Thea^tre Fiction Fantastique Cinema Media Intrigue policiere Musique Danse Varietes Cirque Tab. Libelle Humour Erotisme Sciences Sciences naturelles Sciences exactes Medecine, Sante Technologie Industrie Environnement Artisanat Faune Libelle Arts Litterature Sciences humaines Histoire Religion Ethnologie Sociologie Psychologie Geographie Philosophie Information Libelle Politique Economie Societe Sports Informations pratiques Loisirs Tourisme Aventure, Exploration Insertion sociale Vie professionnelle 2 { Les themes possibles pour la television. Les themes science fiction, music hall, beaux arts et vie quotidienne ne doivent plus ^etre utilises Pour resumer, les termes peuvent qualier, en plus du contenu : { le type de l'uvre dans le cas des ctions (intrigues policieres ), des diusions integrales de spectacles (the^atre, opera, cirque, musique, varietes...) et par extension des retransmissions sportives (sport ) ; { un domaine de connaissance pour tous les termes qualiant les sciences humaines, les arts ou les sciences ; { la tonalite de l'emission pour le code ((humour )). Le theme n'est pas une zone obligatoire et n'est utilise que s'il est explicite. On peut aecter jusqu'a trois valeurs pour les documents de synthese et deux pour les sujets de sommaire. Enn, il est preferable d'en rester au(x) terme(s) le(s) plus general(aux) dans le cas des emissions a contenu composite comme les magazines. Les termes precis sont reserves aux emissions specialisees et par convention, le premier terme entre est le terme le plus large. Les publics En television, la table public regroupe les valeurs caracterisant a la fois le type de public et sa participation. Le Tableau 3 recense ces valeurs. Il est a noter que le code participation du public est utilise si l'on voit ou l'on entend un public en excluant les rires enregistres. Code B C P E F Libelle Programme destine a la jeunesse Scolaires, Professionnels Participation du public a distance Programme educatif Programme d'apprentissage des langues Tab. Code 2 3 4 5 A Libelle Deconseille aux enfants Plus de douze ans Plus de seize ans X ou violent Presence d'un public in situ 3 { Les valeurs possibles pour caracteriser les publics 9 Les combinaisons Au l du temps, il a ete deni des regles de combinaison entre les termes (i.e. genres, themes et public). Ainsi, pour chaque emission, l'acception choisie est explicitee par ces termes selectionnes en parallele. Par exemple, le genre documentaire associee au theme thea^tre renvoie a une emission sur le the^atre alors que ce m^eme theme combine avec le genre retransmission caracterise la diusion d'une piece de the^atre. De plus, il a aussi ete deni une liste de croisements impossibles : par exemple, les genres documentaire et reportage ou encore retransmission et telelm. D'une facon generale, on peut trouver : { un genre, pas de thematique : il s'agit d'une emission a contenu repetitif ou implicite (jeu, journal televise ) ou d'un programme composite a points de vue multiples (une tranche horaire ) ; { un genre, une thematique : il s'agit d'un type d'emission au sens ordinaire du terme ( retransmission sportive, feuilleton ), d'une emission a structure simple et a contenu unique (magazine plateau de societe ) ; { un genre, plusieurs thematiques : il s'agit d'un genre precis de ction isolee (ction dramatique policiere ) ou d'une emission simple a contenu composite (documentaire historico-politique ) ; { deux genres, une thematique : il s'agit d'une emission appartenant a une serie (serie de documentaires ), d'un genre precis (documentaire prenant la forme d'un montage d'archives ), d'une emission composite (magazine compose de reportages ) ou d'une emission ayant un format de diusion specique (spectacle TV realise dans un lieu public ) ; { de deux a quatre genres, plusieurs thematiques : il s'agit d'une emission combinant plusieurs des criteres precedents (serie de dessins animes adaptes d'un livre ). 4 Le traitement documentaire 4.1 Le traitement des ches collection 4.2 Le traitement par genre Comme nous l'avons vu, la typologie INA est relativement souple puisqu'elle permet de combiner plusieurs genres et themes. Parmi toutes ces combinaisons, certaines reviennent regulierement car elles repondent a des criteres de repetitivite et/ou d'originalite dans la forme et le contenu. Elles donnent lieu a des modeles generaux de description qui sont detailles par la suite. 4.2.1 Les emissions a structure simple La Figure 5 detaille le contenu du document de synthese pour cinq combinaisons d'emission simple regulierement utilisees que nous explicitons par la suite. Lorsque les emissions simples appartiennent a des series, la description renvoie a la che collection pour tous les aspects formels ou mise en forme de l'emission. Il arrive aussi parfois que les emissions simples soient decoupees, chacune des sous-parties faisant alors l'objet d'un sujet de sommaire. Le documentaire ou grand reportage On distingue trois categories : { le documentaire isole : caracterise par une mise en image en general conventionnelle et un contenu original ; { le documentaire de creation : caracterise par une mise en image et des dispositifs originaux necessitant une description ; { la serie a auteur unique : caracterisee par une mise en image et une thematique generale commune a l'ensemble de la suite. 10 11 Fig. 5 { Les r egles de traitement presidant la constitution des documents de synthese des emission simples les plus utilisees Émission simple document de synthèse : - type de description = 11 ou 41 sujets de sommaire : - type de description = 52 Documentaire isolé ou Grand Reportage - type de traitement = indexation du contenu - genres = Documentaire - thèmes = indifférents - visionnage = partiel ou complet - description = 5 descripteurs + chapeau + résumé + résumé producteur Feuilleton, Fiction en plusieurs parties - type de traitement = catalogage signalétique - genres = Série, Feuilleton - visionnage = pas de visionnage - description = résumé producteur + n˚épisode Série à personnages récurrents (52 à 90 min) - type de traitement = catalogage synthétique - genres = Série, Téléfilm, Adaptation - visionnage = occasionnel - description = 5 descripteurs + chapeau Fiction - thèmes = Fiction Série à caractère répétitif (13, 26 min) - type de traitement = catalogage signalétique - genres = Série, Sitcom - visionnage = pas de visionnage - description = résumé producteur + n˚épisode Fiction isolée - type de traitement = indexation du contenu - genres = Court métrage, Téléfilm, Adaptation - visionnage = partiel - description = 5 descripteurs + chapeau + résumé Émission plateau - thèmes = indifférents Magazine simple (sans reportages) - type de traitement = catalogage analytique - genres = Magazine - thèmes = indifférents - visionnage = partiel - description = 5 descripteurs + chapeau + résumé Émission pateau sans invités Émission plateau avec invités - type de traitement = catalogage signalétique - genres = Jeu, Reality show - visionnage = pas de visionnage - description = liste des oeuvres si variétés - type de traitement = indexation du contenu - genres = Entretien, Interview, Débat - visionnage = complet ou partiel - description = 5 descripteurs + chapeau + résumé Retransmission - type de traitement = catalogage synthétique ou analytique - genres = Retransmission Sport - thèmes = Sports - visionnage = pas de visionnage - description = descripteurs + chapeau + résumé + lieu de tournage Spectacle, Événement - thèmes = Spectacle - visionnage = pas de visionnage - description = descripteurs + chapeau + liste des oeuvres + résumé La ction On distingue trois categories : { Le feuilleton 5 et la serie a caractere repetitif : cette ction est caracterisee par la convention et la repetition propre a chaque suite des personnages, de la mise en image, des decors et des situations. Il s'agit notamment de comedies de situation, des feuilletons quotidiens ou des dessins animes. { Le telelm 6 et la serie a situation ou personnages recurrents : cette ction est caracterisee par des decors varies en studio et en exterieur, une thematique specique a chaque numero. Il s'agit en general de long metrage diuse en debut de soiree. { La ction isolee : chaque emission est alors caracterisee par l'originalite de son scenario et de ses personnages. Il peut s'agir d'un court ou d'un long metrage mais elle doit ^etre diusee en trois parties au maximum. L'emission plateau On distingue deux categories : { Le plateau ((sans invite)) est caracterise par la repetitivite des dispositifs et du contenu. Les participants eventuels, personnalites ou anonymes, n'apportent pas d'information originale. Il s'agit typiquement des jeux, de certains reality shows ou de varietes. { Le plateau ((avec invite(s))) est caracterisee par par l'originalite du contenu propre a chaque numero. Il s'agit des entretiens, des debats, de certaines varietes ou talk shows. Le magazine plateau sans reportages C'est un magazine avec une part plateau preponderante, diuse en general en direct ou en faux direct : l'image est limitee a de courtes sequences d'illustration. Appartiennent donc a cette categorie, les magazines peu specialises de la journee (vie quotidienne ou divertissement), les magazines politiques centres autour d'un invite et la plupart des magazines culturels de n de soiree organises autour d'un animateur vedette. La retransmission On entend par retransmission toute diusion d'un evenement existant en dehors du media. Cet evenement peut ^etre retransmis dans son integralite ou de maniere partielle, mais les extraits inseres dans une emission a titre d'exemple, d'illustration ou d'information ne relevent pas de ce genre. On distingue deux categories : { la retransmission de spectacle ou d'evenement : il s'agit typiquement d'une ceremonie (ouverture des JO, inauguration d'un monument, ceremonie commemorative, dele militaire...) ou d'un spectacle enregistre dans une salle specialisee ou au cours d'un festival ; { la retransmission sportive : la retransmission peut comprendre des elements inseres (interview, reportages). 4.2.2 Les emissions a structure composite La Figure 6 detaille le contenu du document de synthese pour trois combinaisons d'emission composite regulierement utilisees. Le decoupage de ces emissions en sujets de sommaire est explicite par la suite. 5. Fiction d'une duree inferieure a 52 minutes 6. Fiction d'une duree superieure ou egale a 52 minutes 12 Émission composite document de synthèse : - type de description = 31 sujets de sommaire : - type de description = 52 Journal télévisé - type de traitement = indexation du contenu - genres = Journal télévisé (+ Réalisation dans un lieu public ) - thèmes = pas de thème - visionnage = complet Magazine composite - type de traitement = catalogage synthétique ou analytique - genres = Magazine, Reportage - thèmes = indifférents - visionnage = complet ou partiel - description = chapeau + résumé Magazine de sports Best of - type de traitement = catalogage synthétique ou analytique - genres = Best of - thèmes = indifférents - visionnage = partiel - description = chapeau Magazine de spectacle - type de traitement = catalogage synthétique - thèmes = Sports - visionnage = partiel - description = chapeau + lieu de tournage + résumé producteur - type de traitement = catalogage synthétique - thèmes = Spectacle + sousthèmes - visionnage = partiel - description = chapeau 6 { Les regles de traitement presidant la constitution des documents de synthese des emission composites les plus utilisees Fig. 13 Le journal televise Les informations suivantes sont valables pour tous les journaux televises a l'exception des editions speciales ou lorsqu'un invite participe a l'ensemble de l'emission. Le decoupage du journal televise rend compte de l'alternance plateau/reportage pour les journaux de facture classique, reportage/reportage pour les editions courtes. La logique choisie privilegie les ruptures de forme plut^ot que les changements de contenu. Chaque plateau ou reportage fait l'objet d'un sujet de sommaire. La pseudo-DTD XML suivante decrit ce qui pourrait ^etre le schema d'un journal televise : <!ENTITY % plateau <!ELEMENT journal-TV <!ATTLIST journal-TV <!ELEMENT <!ELEMENT <!ELEMENT <!ATTLIST <!ELEMENT <!ATTLIST <!ELEMENT <!ATTLIST ed-courte ed-classique plat-d ebut plat-d ebut plat-fin plat-fin plat-chronique plat-chronique <!ELEMENT plat-invit e <!ATTLIST plat-invit e <!ELEMENT plat-br eves <!ATTLIST plat-br eves <!ELEMENT plat-lancement <!ATTLIST plat-lancement <!ELEMENT reportage <!ATTLIST reportage "plat-d ebut | plat-fin | plat-chronique | plat-invit e | plat-br eves | plat-lancement"> (ed-courte | ed-classique)> REA string /*r ealisateur du plateau */ RES string /*responsable de l' edition */ PRE string /*pr esentateurs principaux */ PAR string > /*invit es participants */ (plat-d ebut , reportage+ , plat-fin)> (plat-d ebut , (plateau | reportage)+ , plat-fin)> EMPTY> titre string > /*titre-sujet de sommaire */ EMPTY> titre string > /*titre-sujet de sommaire */ EMPTY> titre string /*titre-sujet de sommaire */ JOU string > /*chroniqueur */ EMPTY> titre string /*titre-sujet de sommaire */ GEN string /*participant */ r esum e string > EMPTY> titre string /*titre-sujet de sommaire */ r esum e string > EMPTY> titre string /*titre-sujet de sommaire */ type string > /*allocution, analyse, d eclaration, enqu^ ete, entretien, hommage, portrait, r eaction, r ecit, t emoignage... */ EMPTY> titre string /*titre-sujet de sommaire */ AU string /*journaliste */ GEN string /*pr esentateur, commentateur, participant */ type string /*bande annonce, extrait, micro-trottoir... */ diffusion string /*mode de diffusion : direct, duplex... */ chapeau string > /*forme, mode de diffusion, ev enement ou fait traite */ Le magazine composite avec reportages Les sujets de sommaire listent, dans l'ordre chronologique, les plateaux, les dierents reportages et, eventuellement les interprogrammes. La pseudo-DTD XML suivante decrit ce qui pourrait ^etre le schema d'un magazine composite avec reportages : <!ELEMENT magazine <!ATTLIST magazine <!ELEMENT plateau <!ATTLIST plateau <!ELEMENT reportage <!ATTLIST reportage ((plateau | reportage)*)> REA string /*r ealisateur g en eral de l' emission */ PRE string /*animateurs */ PAR string /*invit es plateau s'ils participent a toute l'emission */ chapeau string > /*si il y a une th ematique g enerale */ EMPTY> titre string /*titre-sujet de sommaire */ PRE string /*pr esentateur */ chapeau string > /*r esum e des interventions des invit es */ EMPTY> titre string /*titre-sujet de sommaire */ 14 JOU string PAR string production string chapeau string r esum e string > /*auteur du sujet */ /*participants eventuels */ /*soci et e, copyright du reportage */ /*forme, th ematique et principaux participants */ /*r esum e chronologique des principales s equences */ Le magazine de sport ou de spectacle est un type particulier de magazine composite. Ainsi, les regles de decoupage du document obeissent aux m^emes regles. Cependant, la plupart des elements qui le composent font l'objet d'un traitement normalise. Le best of 4.3 Les traitements particuliers La tranche horaire On entend par tranche horaire un cadre de diusion a periodicite et horaires reguliers deni par un titre, une thematique et/ou un public specique. La tranche horaire composite est caracterisee par l'heterogeneite des programmes diuses, la multiplicite des origines de production et la structuration forte du deroulement chronologique. La description s'eectue au niveau de la tranche horaire et des emissions incluses. On distingue trois categories principales (Figure 7) : { tranche a format recurrent : il s'agit d'une tranche a structure reguliere dont les numeros n'ont pas de thematique distincte ; { tranche a editions thematiques : chaque numero a une thematique distincte ; { tranche exceptionnelle : soirees speciales composites organisees autour d'un evenement (Telethon, hommage ). Tranche horaire composite - type de description = 21 - programmes inclus = 12, 22, 32, 42 - forme = code 3 - genre = pas de genre - titre tranche horaire Tranche à format récurrent - type de traitement = catalogage signalétique - visionnage = pas de visionnage - description = sujets de sommaire Fig. Tranche exceptionnelle - type de traitement = indexation formalle - visionnage = partiel - description = sujets de sommaire - chapeau - résumé producteur Tranche à éditions thématiques - type de traitement = catalogage synthétique - visionnage = pas de visionnage - description = sujets de sommaire - résumé producteur 7 { Le traitement documentaire des tranche horaires composites Autres cas particuliers Remerciements Nous tenons a remercier Michele Wautelet, pour les discussions nombreuses et fructueuses qui ont alimentees la redaction de cette etude. 15 References [1] Auffret, Gwendal. Structuration de documents audiovisuels et publication electronique - Constitution d'une cha^ ne editoriale num erique pour la mise en ligne de collections audiovisuelles. Th ese de doctorat, Universite de Technologie de Compiegne, France, Decembre 2000. [2] Bachimont, Bruno. Indexation audiovisuelle : une problematique en pleine evolution. In L'Objet - Objets et multimedia, volume 6, nÆ 2, pages 171-191, Edition Hermes, France, 2000. [3] Inatheque - Manuel d'indexation. Le traitement documentaire des programmes de radio et de television a l'Inath eque. 1996 & mise a jour mars 2001. 16