Etude du Manuel d`Indexation commun a tous les

Transcription

Etude du Manuel d`Indexation commun a tous les
Etude
du Manuel d'Indexation
commun a tous les documentalistes
Raphael Troncy
[email protected]
12 avril 2001
1
Introduction
a caractere IndusL'INA (Institut National de l'Audiovisuel) est un Etablissement
Public de l'Etat
triel et Commercial (EPIC) dont la mission principale est de constituer le patrimoine de la television
et de la radio francaise. Cette mission patrimoniale se decline en deux departements :
{ Le Departement Droits et Archives (DDA), heritier du fond des archives de l'ORTF, collecte les
programmes des cha^nes de television et des radios publiques. Il les stocke et eventuellement les
restaure, mais il doit avant tout en faciliter l'acces aux professionnels de l'audiovisuel.
{ L'Inatheque de France est chargee de la mise en uvre du Dep^ot Legal de la Radio-Television
deni par la loi du 20 juin 1992. Ainsi, depuis le 1er janvier 1995, l'Inatheque recense l'integralite
des programmes des diuseurs nationaux hertziens de television (soit six cha^nes) et ceux des
cinq cha^nes nationales de Radio France. Par ailleurs, elle documente et conserve les programmes
de production francaise.
Chacun de ces deux departements doit donc gerer et archiver un ux documentaire entrant continu,
c'est-a-dire selectionner et documenter une partie de ce ux. La selection suit un certain nombres
de regles denies par l'institution. La documentation, elle, est eectuee par des documentalistes et
concerne le catalogage et l'indexation des documents audiovisuels.
La problematique de l'indexation concerne la creation et la constitution d'index pour permettre
une recherche documentaire. La creation des index repose sur l'analyse ou l'interpretation du contenu
du document de maniere a en degager les caracteristiques les plus representatives. Ces caracteristiques
sont formulees dans un langage naturel contr^ole, specialement choisi ou concu pour faciliter la recherche. A l'INA, l'indexation des documents s'eectue a travers la redaction de notices documentaires
contenant des champs contr^oles et des mots-cles inscrits dans un thesaurus dont on a normalise la
semantique. Mais comme le souligne Bachimont dans [2], la vision consistant a assimiler l'indexation
a une interpretation du contenu appelle les remarques suivantes :
{ l'indexation est une interpretation qui est soumise, d'une part, a la subjectivite de l'indexeur,
dont on tente de surmonter la variabilite et, d'autre part, a la nalite de la consultation (pour
qui indexe-t'on?) que l'on veut optimiser ;
{ l'indexation ne rend pas compte des proprietes intrinseques et objectives d'un document mais
exprime un point de vue en fonction d'une application visee des documents (retrouver des documents, pour quoi faire?).
Autrement dit, il n'existe pas d'indexation universelle ou d'indexation independante d'un contexte
applicatif. A l'INA, la relativite de l'indexation est ma^trisee par un ensemble de regles et d'usages
propres aux metiers des documentalistes qui contraint la description des documents. Il en resulte un
manque de souplesse pour exprimer les index mais ceux-ci deviennent plus pertinents par rapport au
contenu et a l'exploitation visee des documents. Ces regles et usages sont disponibles dans un manuel
d'indexation [3], sorte de bible qui accompagne le travail des documentalistes.
1
Il est utile ici de preciser la specicite des deux cha^nes de television publiques (France2 et France3)
et des radios publiques. En eet, ces diuseurs sont a la fois concernes par la mission du Departement
Droits et Archives mais rentrent aussi dans le cadre du Dep^ot Legal. Theoriquement, les programmes
issus de ces diuseurs devraient donc faire l'objet d'un double traitement documentaire donnant lieu a
la redaction de deux notices. Cependant, la notice provenant de l'Inatheque etant plus complete, elle
tend a ^etre hegemonique laissant au DDA la gestion des fonds anciens. Ce document a donc pour but de
synthetiser les connaissances et regles contenues dans le manuel utilise par les documentalistes de l'Inatheque pour pouvoir ensuite les representer symboliquement via un formalisme de representation de
connaissance. La base de connaissance ainsi formee permettra d'eectuer des manipulations formelles
sur les descriptions tels que proposer des schemas de description ou d'en enrichir des existants.
2
Programme, emission, document : un cycle de vie documentaire
2.1 La grille de programmes
La mission de l'Inatheque consiste a capter un ux hebdomadaire entrant de programmes, a
decouper ce ux et a appliquer un traitement documentaire a chacune des entites le composant.
Le systeme d'entree des donnees traitees est donc, pour chacun des diuseurs, une grille previsionnelle
des elements diuses appelee grille des programmes. Cette grille permet de decrire la programmation
d'une cha^ne de diusion pour une periode donnee (la semaine). C'est un objet deni par un nom et
une date d'eet, et courant sur sept jours (Figure 1).
Grille de Programmes
- nom
(ex : Grille des programmes de France 2)
- date d'effet
(ex : Semaine du 19/10/1998)
- journée de diffusion
cardinalité = 7
type = journée de programme
Fig.
1 { Une representation objet de la grille de programmes
La journee de programme est un ensemble de descriptifs de programmes appeles cases antenne.
Tous les elements diuses font au moins l'objet d'une identication, qu'ils relevent ou non du Dep^ot
Legal. A chaque case antenne correspond un element de programme (ELP) qui est l'unite materielle 1 .
Mais le materiel (et donc l'ELP correspondant) n'equivaut pas systematiquement a une entite de
programme.
2.2 Vers une unite de traitement documentaire
Un des premiers problemes auxquels ont ete confrontes les documentalistes de l'Inatheque concerne
l'unite de traitement documentaire a adopter, c'est-a-dire determiner l'entite minimale sur laquelle va
porter le traitement. En eet, comme le montre Auret dans [1], avant de devenir un document,
le contenu audiovisuel est un programme qui s'inscrit dans un cycle de vie documentaire. Ainsi, le
producteur, le diuseur puis l'archive ne vont pas aborder les contenus de la m^eme facon, donnant
lieu a autant d'unites de traitement documentaire possibles (Figure 2).
Du point de vue de sa structure de production (ou encore structure propre ), le programme peut
^etre de structure simple (homogene) ou complexe, c'est-a-dire compose de un ou plusieurs elements
autonomes. L'unite documentaire a associer pourrait donc ^etre le programme dans son integralite
lorsqu'il est simple ou ses dierents elements lorsqu'il est composite.
1. Par materiel, on entend l'ensemble des supports verses ou recopies. A un ELP sont associes une ou plusieurs cassettes
en fonction de la duree de l'ELP
2
Programme
-
Émission
titre
heure théorique de début et fin
mode de diffusion
périodicité
sélection Dépôt Légal
type de traitement
type de description
typologies
est-un
-
est-un
Structure simple
Structure
composite
document de synthèse
-document de synthèse
-sujets de sommaire
inclus
Collection
- titre
- fiche mère
Le programme selon sa structure de production
Fig.
titre
heure théorique de début et fin
mode de diffusion
périodicité
sélection Dépôt Légal
type de traitement
type de description
typologies
inclus
Tranche horaire
- titre
- sujets de sommaire
L'émission selon sa structure de diffusion
2 { La description du document a l'Inatheque : structure de production vs structure de diusion
Du point de vue du diuseur, le programme entre dans une logique de programmation qui reete
la politique editoriale de la cha^ne. Une nouvelle structure est donnee lors de sa diusion gr^ace a un
habillage ou a des coupures publicitaires. On parle alors d'emission. Celle-ci peut appartenir a une
tranche horaire caracterisee par une thematique recurrente ou encore a une collection regroupant un
certain nombre d'emissions ayant en commun un titre, une thematique, une mise en forme et au moins
un auteur et dont chaque numero est diusable independamment. Ici, le traitement documentaire peut
donc s'eectuer au niveau de ces deux ((macro-entites )).
Des lors qu'elle est archivee, l'emission devient un document pour lequel une notice documentaire
est redigee. Les documentalistes ont decide de conserver ces dierents plans de structuration (production et diusion). La notice documentaire est donc hierarchisee et comprend deux niveaux : un
document dit de ((synthese )) et des sujets de sommaire.
{ Le document de synthese sert a decrire un programme dans sa globalite. Les informations concernant l'unite sont reparties, par categorie, dans des zones formatees appelees champs. Il comprend :
un titre, une heure theorique de debut et une heure theorique de n, le mode de diusion (direct,
diere, duplex...), sa periodicite (quotidien, week-end, hebdomadaire, mensuel, annuel...), une
mention precisant la selection Dep^ot Legal ou non, un type de traitement (section 2.3), un type
de description (section 2.4) qui permet de preciser les notions de structure et d'inclusion, et des
typologies (section 3).
{ Les sujets de sommaire permettent de decliner les dierents elements constituant le programme.
Selon sa structure propre, il s'agira des elements composant le sommaire d'une emission composite 2 ou d'une tranche horaire 3. Selon sa structure de diusion, il s'agira de referencer les
interprogrammes 4, les elements d'habillage de l'emission (sequences de presentation ou de lancement, sequences de conclusion) ou encore les ruptures dues a un incident technique. Depuis
peu, les sujets de sommaire contiennent eux-aussi des champs precisant un type de traitement
(section 2.3), un type de description (section 2.4) et des typologies (section 3).
Enn, la collection fait aussi l'objet d'une notice documentaire appelee che mere. Elle n'est pas
le resultat de l'addition des contenus de toutes les emissions mais s'attache a la description de ses
constantes thematiques et formelles, de la scenographie ou encore du dispositif technique mis en place.
2. Emission
caracterisee par l'emploi successif d'elements autonomes par leur forme et leur contenu (ex : plateau,
reportage et entretien d'un magazine)
3. La tranche horaire est en fait vue comme un type particulier d'emission composite
4. Tout ce qui constitue l'habillage d'une cha^ne : bandes annonces, espaces publicitaires, jingles...
3
2.3 Les types de traitement
Un document audiovisuel peut donc ^etre observe a des niveaux dierents : la collection, l'emission
ou les elements de l'emission. De la m^eme facon, il peut ^etre vu sous des angles dierents (d'une simple
identication a une description precise du contenu et de la mise en forme), a partir de sources multiples
(visionnage ou ecoute, documentation d'accompagnement fournie par le producteur, le diuseur ou la
presse specialisee encore appelee peri-documentation ). Le traitement documentaire doit tenir compte
de l'economie generale du secteur concerne (le public vise et ses demandes, le volume des documents
conserves, le systeme de donnees) et respecter un equilibre de traitement entre les dierents genres
audiovisuels. Ces deux facteurs ont conduit a faire les choix suivants :
{ une description approfondie des collections et des ensembles : cette option permet de limiter le
traitement de chaque emission appartenant a un ensemble a ses particularites propres ;
{ un traitement documentaire dierencie par type d'emission, le choix du niveau de traitement
etant lie a la richesse et a l'originalite de l'information ;
{ une utilisation denie des dierentes sources d'information en fonction de leur importance respective et du niveau de traitement selectionne.
Cette dierenciation de traitement documentaire est materialisee en pratique par six niveaux de
description : (ici, classe par ordre croissant d'information)
{ L'identication concerne les documents non selectionnes dep^ot legal, les rediusions et les interprogrammes. Elle comprend pour l'essentiel des informations sur la programmation (cha^ne,
jour calendaire, horaire, duree), les titres, les societes de production et les typologies.
{ Le catalogage signaletique recense les elements objectifs de l'emission : generique, structure
de decoupage, thematique generale. Ainsi, il comprend en plus de l'identication les auteurs,
presentateurs, interpretes et participants principaux, et un decoupage de l'emission en sujets de
sommaire si celui-ci est explicitement identie sur les sources papiers.
{ Le catalogage analytique repond aux questions suivantes : qui parle ? [a qui ?] de quoi ? ou ?
quand ? dans quel ordre ? Il comprend, en plus du catalogage signaletique, un resume redige
par le documentaliste a partir de la documentation papier fournie par le diuseur et/ou d'un
visionnage partiel.
{ Le catalogage synthetique est une variante simpliee du catalogage analytique dont il se distingue
par une absence systematique de resume chronologique. Mais il comprend, en plus du catalogage signaletique, le generique complementaire, un resume du producteur et des descripteurs
principaux repondant a ((ou, de quoi, et quand )).
{ L'indexation du contenu ajoute au catalogage la transcription du contenu sous forme synthetique.
Contrairement au catalogage, elle implique une part d'interpretation du documentaliste. Le
principal apport concerne un resume en langage libre mais qui se tient au plus pres du vocabulaire
du document lui-m^eme et un choix de mots cles utilises comme descripteurs explicites.
{ L'indexation formelle, plus particulierement utilisee dans les ches collection, est centree sur
la description des constantes structurelles et formelles du document comme l'organisation et
le deroulement des interventions, les dispositifs techniques, le decor, la lumiere, le rythme de
montage ou encore l'utilisation de la musique.
Il existe deux sources principales d'information pour les descriptions, utilisees seules ou en combinaison :
{ le visionnage ou l'ecoute des documents (complet, partiel ou occasionnel) ;
{ la documentation ecrite.
En regle generale, la documentation papier est la premiere entree. En fonction de son importance et
du niveau de traitement prevu, elle peut ^etre completee par un visionnage ou une ecoute.
4
2.4 Les types de description
Comme nous l'avons deja vu, une emission peut ^etre de structure simple ou complexe ou encore
appartenir a un ensemble (appelee collection ). Le type de description permet justement de preciser le
mode de diusion de l'entite et sa structure propre. Pour cela, seize codes recensent les choix possibles :
{ Les ches collection
{ 10 : collection d'emissions simples chaque numero (ou emission) est diusable isolement
et a une structure de production homogene ;
{ 20 : collection de tranche horaire ;
{ 30 : collection d'emissions composites chaque numero (ou emission) est diusable isolement et a une structure composite ;
{ 40 : emission en plusieurs episodes ou parties suite a episodes ouverts (feuilleton, emission
a suite).
{ Les notices documentaires
{ 11 : emission simple
emission isolee ou appartenant a une collection a structure de
production simple ;
{ 21 : tranche horaire ;
{ 31 : emission composite emission isolee ou appartenant a une collection a structure de
production composite ;
{ 41 : episode ou partie d'un videogramme
partie, episode... appartenant a une suite
fermee, a episodes ouverts ;
{ 61 : journee temoin ;
{ 71 : interprogramme.
{ Les notices documentaires de programmes inclus (dans une tranche horaire ou une emission)
{ 12 : emission simple incluse ;
{ 22 : tranche horaire incluse ;
{ 32 : emission composite incluse ;
{ 42 : episode ou partie d'un videogramme inclus ;
{ 52 : sujet de sommaire ;
{ 72 : interprogramme inclus.
Le type de description permet donc de recenser les regles de decoupage des programmes. Il
determine aussi le niveau de traitement documentaire qu'on va leurs associer. Il restreint donc les
champs qui vont ^etre values. De plus, l'Inatheque a developpe une typologie des documents an d'associer un traitement documentaire selon leurs genres. L'etude de cette typologie est l'objet de la section
suivante.
)
)
)
)
)
)
3
La typologie des documents
Pour caracteriser une emission dans sa globalite ou alors l'une de ses parties (qui fait l'objet d'un
sujet de sommaire), l'INA utilise un vocabulaire formalise ou typologie. Les typologies font l'objet de
plusieurs listes d'autorite :
{ la typologie Mediametrie (section 3.1) ;
{ la typologie INA basee sur des genres, des themes et des publics (section 3.2).
3.1 La typologie Mediametrie
Cette typologie est caracterisee par une liste de termes pre-coordonnes et hierarchises. Par exemple,
les Figures 3 et 4 montrent les branches de l'arbre correspondant respectivement aux emissions de type
ction et sport. Ainsi, le code ACA indique que l'on a un programme de type ction, serie, policiere
5
(par exemple : Navarro ) tandis que le code FBM specie un type sport, magazine, multisports (par
exemple : Stade 2 ). Chaque terme est donc une expression qui s'utilise seule.
En fait, cette typologie est fortement liee a l'usage des publicitaires puisque son objectif est de
fournir une classication toujours plus precise aux diuseurs et aux annonceurs. Elle est donc adapte
au type de description dep^ot legal fonde sur la programmation mais l'est beaucoup moins d'un point de
vue archives. Cette typologie ne represente qu'un champ supplementaire dans les notices, non ma^trise
car les documentalistes recopient la valeur donnee par Mediametrie.
3.2 La typologie INA
La typologie INA est un systeme a facettes compose de plusieurs listes : des genres, des themes et
des publics. Chaque liste comporte un nombre restreint de termes. Les emissions sont caracterisees par
des combinaisons de valeurs mais globalement, la typologie qui en resulte est moins raÆnee que celle
provenant de Mediametrie. Ce choix de depart presente comme avantage une grande souplesse liee a
la capacite a prendre en compte des genres nouveaux en raison de la multiplicite des combinaisons
possibles. L'inconvenient majeur vient du fait qu'il est impossible de hierarchiser ces combinaisons.
Cependant, c'est cette typologie qui est fortement utilisee et qui va conditionner les descriptions
documentaires a produire. Nous la detaillons donc par la suite.
Les genres
Ils caracterisent, en regle generale, la forme audiovisuelle de l'emission. Cependant, certaines valeurs
codent egalement le mode de diusion (retransmission ) ou de realisation (realisation TV dans un lieu
public ), le statut de l'objet diuse (creation televisuelle ), un type de programmation (tranche horaire ),
l'appartenance a un ensemble (serie ), le media d'origine (long metrage ou telelm )... Le Tableau 1
enumere l'ensemble des genres possibles pour la television.
Libelle
Adaptation
Animation
Bande annonce
Best of
Breve
Comedie de situation
Conference de presse
Cours d'enseignement
Court metrage
Creation televisuelle
Debat
Declaration
Documentaire
Entretien, Interview
Extrait
Libelle
Feuilleton
Interlude
Jeu
Journal televise
Journee temoin
Long metrage
Magazine
Message info
Message publicitaire
Micro-trottoir
Mini-programme
Montage d'archives
Oeuvre enregistree en studio
Plateau en situation
Presse lmee
Libelle
Programme a base de clips
Programme atypique
Realisation dans un lieu public
Reality show
Recit, Portrait
Reportage
Retransmission
Retrospective
Revue de presse
Serie
Spectacle TV
Telelm
Temoignage
Tranche horaire
Videoclip
1 { Les genres possibles pour la television. Les genres creation originale et telefilm court
ne sont plus utilises
Tab.
Actuellement, l'usage contraint toute description a posseder au moins un genre et au plus quatre
pour les documents de synthese et au plus deux pour les sujets de sommaire. Par convention, le premier
terme entre est le terme le plus general dans la mesure ou il caracterise l'objet decrit lui-m^eme et non
son environnement. Par exemple, telelm et serie indique une ction d'une duree superieure a 52
minutes diuse dans le cadre d'une serie.
6
7
Fig. 3 { Branche de l'arbre correspondant aux emissions de type ction ; le code ACA designe par
exemple une emission de type fiction, serie, policiere
Fiction : A
Long métrage : A
- Comédie : A
- Policier, Espionnage, Suspense : B
- Aventure : C
- SF, Fantastique : D
-X:E
- Drame psychologique, Comédie dramatique : F
- Guerre : G
- Western : H
- Historique : I
- Erotique : J
- Faits de société : K
- Film musical ou Comédie musicale : L
- Animation : M
- Documentaire : N
Téléfilm : B
- Comédie : A
- Policier, Espionnage, Suspense : B
- Aventure : C
- SF, Fantastique : D
-X:E
- Drame psychologique, Comédie dramatique : F
- Guerre : G
- Western : H
- Historique : I
- Erotique : J
- Faits de société : K
- Comédie musicale : L
- Documentaire : N
Série : C
- Policière : A
- Humoristique : B
- Autre : C
- Feuilleton : D
- Théâtre : E
- Court métrage : F
- Dessin animé : G
- Animation : H
8
Fig. 4 { Branche de l'arbre correspondant aux emissions de type sport ; le code FBM designe par exemple
une emission de type sport, magazine, multisports
Sport : F
Retransmission : A
- Football : A
- Rugby : B
- Tennis : C
- Sport neige, glace : D
- Cyclisme : E
- Golf : F
- Sports mécaniques : G
- Athlétisme : H
- Sports équestres : I
- Sports de combat : J
- Corrida : K
- Coulisses : L
- Autre sport : M
Magazine : B
- Football : A
- Rugby : B
- Tennis : C
- Sport neige, glace : D
- Cyclisme : E
- Golf : F
- Sports mécaniques : G
- Athlétisme : H
- Sports équestres : I
- Sports de combat : J
- Corrida : K
- Autre sport : L
- Multisports : M
- Magazine mixte : C
- Pronostic : D
Jeux Olympiques : E
- Hiver : A
- Eté : B
Les thematiques
Une seconde liste de termes permet de caracteriser la thematique generale consideree sous l'un ou
l'autre des angles suivants :
{ le contenu proprement parle de l'emission c'est-a-dire ce dont on parle ;
{ son type, c'est-a-dire la reference du domaine dans laquelle elle s'inscrit (spectacle, sciences,
information, vie quotidienne...).
Il y a une exception a ce double usage : cinema n'est utilise que pour qualier le contenu. En eet, le
deuxieme sens est, en general, implicite : un long metrage est necessairement cinematographique. Le
Tableau 2 enumere l'ensemble des themes possibles pour la television.
Libelle
Spectacle
Thea^tre
Fiction
Fantastique
Cinema
Media
Intrigue policiere
Musique
Danse
Varietes
Cirque
Tab.
Libelle
Humour
Erotisme
Sciences
Sciences naturelles
Sciences exactes
Medecine, Sante
Technologie
Industrie
Environnement
Artisanat
Faune
Libelle
Arts
Litterature
Sciences humaines
Histoire
Religion
Ethnologie
Sociologie
Psychologie
Geographie
Philosophie
Information
Libelle
Politique
Economie
Societe
Sports
Informations pratiques
Loisirs
Tourisme
Aventure, Exploration
Insertion sociale
Vie professionnelle
2 { Les themes possibles pour la television. Les themes science fiction, music hall, beaux
arts et vie quotidienne ne doivent plus ^etre utilises
Pour resumer, les termes peuvent qualier, en plus du contenu :
{ le type de l'uvre dans le cas des ctions (intrigues policieres ), des diusions integrales de spectacles (the^atre, opera, cirque, musique, varietes...) et par extension des retransmissions sportives
(sport ) ;
{ un domaine de connaissance pour tous les termes qualiant les sciences humaines, les arts ou les
sciences ;
{ la tonalite de l'emission pour le code ((humour )).
Le theme n'est pas une zone obligatoire et n'est utilise que s'il est explicite. On peut aecter jusqu'a
trois valeurs pour les documents de synthese et deux pour les sujets de sommaire. Enn, il est preferable
d'en rester au(x) terme(s) le(s) plus general(aux) dans le cas des emissions a contenu composite comme
les magazines. Les termes precis sont reserves aux emissions specialisees et par convention, le premier
terme entre est le terme le plus large.
Les publics
En television, la table public regroupe les valeurs caracterisant a la fois le type de public et sa
participation. Le Tableau 3 recense ces valeurs. Il est a noter que le code participation du public est
utilise si l'on voit ou l'on entend un public en excluant les rires enregistres.
Code
B
C
P
E
F
Libelle
Programme destine a la jeunesse
Scolaires, Professionnels
Participation du public a distance
Programme educatif
Programme d'apprentissage des langues
Tab.
Code
2
3
4
5
A
Libelle
Deconseille aux enfants
Plus de douze ans
Plus de seize ans
X ou violent
Presence d'un public in situ
3 { Les valeurs possibles pour caracteriser les publics
9
Les combinaisons
Au l du temps, il a ete deni des regles de combinaison entre les termes (i.e. genres, themes et
public). Ainsi, pour chaque emission, l'acception choisie est explicitee par ces termes selectionnes en
parallele. Par exemple, le genre documentaire associee au theme thea^tre renvoie a une emission sur le
the^atre alors que ce m^eme theme combine avec le genre retransmission caracterise la diusion d'une
piece de the^atre. De plus, il a aussi ete deni une liste de croisements impossibles : par exemple, les
genres documentaire et reportage ou encore retransmission et telelm. D'une facon generale, on peut
trouver :
{ un genre, pas de thematique : il s'agit d'une emission a contenu repetitif ou implicite (jeu, journal
televise ) ou d'un programme composite a points de vue multiples (une tranche horaire ) ;
{ un genre, une thematique : il s'agit d'un type d'emission au sens ordinaire du terme ( retransmission sportive, feuilleton ), d'une emission a structure simple et a contenu unique (magazine
plateau de societe ) ;
{ un genre, plusieurs thematiques : il s'agit d'un genre precis de ction isolee (ction dramatique
policiere ) ou d'une emission simple a contenu composite (documentaire historico-politique ) ;
{ deux genres, une thematique : il s'agit d'une emission appartenant a une serie (serie de documentaires ), d'un genre precis (documentaire prenant la forme d'un montage d'archives ), d'une
emission composite (magazine compose de reportages ) ou d'une emission ayant un format de
diusion specique (spectacle TV realise dans un lieu public ) ;
{ de deux a quatre genres, plusieurs thematiques : il s'agit d'une emission combinant plusieurs des
criteres precedents (serie de dessins animes adaptes d'un livre ).
4
Le traitement documentaire
4.1 Le traitement des ches collection
4.2 Le traitement par genre
Comme nous l'avons vu, la typologie INA est relativement souple puisqu'elle permet de combiner
plusieurs genres et themes. Parmi toutes ces combinaisons, certaines reviennent regulierement car elles
repondent a des criteres de repetitivite et/ou d'originalite dans la forme et le contenu. Elles donnent
lieu a des modeles generaux de description qui sont detailles par la suite.
4.2.1 Les emissions a structure simple
La Figure 5 detaille le contenu du document de synthese pour cinq combinaisons d'emission simple
regulierement utilisees que nous explicitons par la suite. Lorsque les emissions simples appartiennent a
des series, la description renvoie a la che collection pour tous les aspects formels ou mise en forme de
l'emission. Il arrive aussi parfois que les emissions simples soient decoupees, chacune des sous-parties
faisant alors l'objet d'un sujet de sommaire.
Le documentaire ou grand reportage
On distingue trois categories :
{ le documentaire isole : caracterise par une mise en image en general conventionnelle et un contenu
original ;
{ le documentaire de creation : caracterise par une mise en image et des dispositifs originaux
necessitant une description ;
{ la serie a auteur unique : caracterisee par une mise en image et une thematique generale commune
a l'ensemble de la suite.
10
11
Fig. 5 { Les r
egles de traitement presidant la constitution des documents de synthese des emission
simples les plus utilisees
Émission simple
document de synthèse :
- type de description = 11 ou 41
sujets de sommaire :
- type de description = 52
Documentaire isolé
ou Grand Reportage
- type de traitement = indexation du contenu
- genres = Documentaire
- thèmes = indifférents
- visionnage = partiel ou
complet
- description = 5 descripteurs
+ chapeau + résumé + résumé producteur
Feuilleton, Fiction
en plusieurs parties
- type de traitement =
catalogage signalétique
- genres = Série,
Feuilleton
- visionnage = pas de
visionnage
- description = résumé
producteur + n˚épisode
Série à personnages
récurrents (52 à 90 min)
- type de traitement =
catalogage synthétique
- genres = Série, Téléfilm,
Adaptation
- visionnage = occasionnel
- description = 5 descripteurs + chapeau
Fiction
- thèmes = Fiction
Série à caractère
répétitif (13, 26 min)
- type de traitement =
catalogage signalétique
- genres = Série, Sitcom
- visionnage = pas de
visionnage
- description = résumé
producteur + n˚épisode
Fiction isolée
- type de traitement =
indexation du contenu
- genres = Court métrage, Téléfilm, Adaptation
- visionnage = partiel
- description = 5 descripteurs + chapeau + résumé
Émission plateau
- thèmes = indifférents
Magazine simple
(sans reportages)
- type de traitement = catalogage analytique
- genres = Magazine
- thèmes = indifférents
- visionnage = partiel
- description = 5 descripteurs
+ chapeau + résumé
Émission pateau
sans invités
Émission plateau
avec invités
- type de traitement =
catalogage signalétique
- genres = Jeu, Reality
show
- visionnage = pas de
visionnage
- description = liste des
oeuvres si variétés
- type de traitement =
indexation du contenu
- genres = Entretien,
Interview, Débat
- visionnage = complet
ou partiel
- description = 5 descripteurs + chapeau +
résumé
Retransmission
- type de traitement = catalogage synthétique ou analytique
- genres = Retransmission
Sport
- thèmes = Sports
- visionnage = pas de
visionnage
- description = descripteurs + chapeau + résumé + lieu de tournage
Spectacle,
Événement
- thèmes = Spectacle
- visionnage = pas de
visionnage
- description = descripteurs + chapeau + liste
des oeuvres + résumé
La ction
On distingue trois categories :
{ Le feuilleton 5 et la serie a caractere repetitif : cette ction est caracterisee par la convention
et la repetition propre a chaque suite des personnages, de la mise en image, des decors et des
situations. Il s'agit notamment de comedies de situation, des feuilletons quotidiens ou des dessins
animes.
{ Le telelm 6 et la serie a situation ou personnages recurrents : cette ction est caracterisee par
des decors varies en studio et en exterieur, une thematique specique a chaque numero. Il s'agit
en general de long metrage diuse en debut de soiree.
{ La ction isolee : chaque emission est alors caracterisee par l'originalite de son scenario et de ses
personnages. Il peut s'agir d'un court ou d'un long metrage mais elle doit ^etre diusee en trois
parties au maximum.
L'emission plateau
On distingue deux categories :
{ Le plateau ((sans invite)) est caracterise par la repetitivite des dispositifs et du contenu. Les
participants eventuels, personnalites ou anonymes, n'apportent pas d'information originale. Il
s'agit typiquement des jeux, de certains reality shows ou de varietes.
{ Le plateau ((avec invite(s))) est caracterisee par par l'originalite du contenu propre a chaque
numero. Il s'agit des entretiens, des debats, de certaines varietes ou talk shows.
Le magazine plateau sans reportages
C'est un magazine avec une part plateau preponderante, diuse en general en direct ou en faux
direct : l'image est limitee a de courtes sequences d'illustration. Appartiennent donc a cette categorie,
les magazines peu specialises de la journee (vie quotidienne ou divertissement), les magazines politiques
centres autour d'un invite et la plupart des magazines culturels de n de soiree organises autour d'un
animateur vedette.
La retransmission
On entend par retransmission toute diusion d'un evenement existant en dehors du media. Cet
evenement peut ^etre retransmis dans son integralite ou de maniere partielle, mais les extraits inseres
dans une emission a titre d'exemple, d'illustration ou d'information ne relevent pas de ce genre. On
distingue deux categories :
{ la retransmission de spectacle ou d'evenement : il s'agit typiquement d'une ceremonie (ouverture
des JO, inauguration d'un monument, ceremonie commemorative, dele militaire...) ou d'un
spectacle enregistre dans une salle specialisee ou au cours d'un festival ;
{ la retransmission sportive : la retransmission peut comprendre des elements inseres (interview,
reportages).
4.2.2 Les emissions a structure composite
La Figure 6 detaille le contenu du document de synthese pour trois combinaisons d'emission composite regulierement utilisees. Le decoupage de ces emissions en sujets de sommaire est explicite par
la suite.
5. Fiction d'une duree inferieure a 52 minutes
6. Fiction d'une duree superieure ou egale a 52 minutes
12
Émission composite
document de synthèse :
- type de description = 31
sujets de sommaire :
- type de description = 52
Journal télévisé
- type de traitement =
indexation du contenu
- genres = Journal télévisé (+
Réalisation dans un lieu public )
- thèmes = pas de thème
- visionnage = complet
Magazine composite
- type de traitement = catalogage
synthétique ou analytique
- genres = Magazine, Reportage
- thèmes = indifférents
- visionnage = complet ou partiel
- description = chapeau + résumé
Magazine de sports
Best of
- type de traitement = catalogage synthétique ou analytique
- genres = Best of
- thèmes = indifférents
- visionnage = partiel
- description = chapeau
Magazine de spectacle
- type de traitement =
catalogage synthétique
- thèmes = Sports
- visionnage = partiel
- description = chapeau + lieu de
tournage + résumé producteur
- type de traitement =
catalogage synthétique
- thèmes = Spectacle + sousthèmes
- visionnage = partiel
- description = chapeau
6 { Les regles de traitement presidant la constitution des documents de synthese des emission
composites les plus utilisees
Fig.
13
Le journal televise
Les informations suivantes sont valables pour tous les journaux televises a l'exception des editions
speciales ou lorsqu'un invite participe a l'ensemble de l'emission. Le decoupage du journal televise rend
compte de l'alternance plateau/reportage pour les journaux de facture classique, reportage/reportage
pour les editions courtes. La logique choisie privilegie les ruptures de forme plut^ot que les changements
de contenu. Chaque plateau ou reportage fait l'objet d'un sujet de sommaire. La pseudo-DTD XML
suivante decrit ce qui pourrait ^etre le schema d'un journal televise :
<!ENTITY
% plateau
<!ELEMENT journal-TV
<!ATTLIST journal-TV
<!ELEMENT
<!ELEMENT
<!ELEMENT
<!ATTLIST
<!ELEMENT
<!ATTLIST
<!ELEMENT
<!ATTLIST
ed-courte
ed-classique
plat-d
ebut
plat-d
ebut
plat-fin
plat-fin
plat-chronique
plat-chronique
<!ELEMENT plat-invit
e
<!ATTLIST plat-invit
e
<!ELEMENT plat-br
eves
<!ATTLIST plat-br
eves
<!ELEMENT plat-lancement
<!ATTLIST plat-lancement
<!ELEMENT reportage
<!ATTLIST reportage
"plat-d
ebut | plat-fin | plat-chronique | plat-invit
e | plat-br
eves |
plat-lancement">
(ed-courte | ed-classique)>
REA string
/*r
ealisateur du plateau */
RES string
/*responsable de l'
edition */
PRE string
/*pr
esentateurs principaux */
PAR string >
/*invit
es participants */
(plat-d
ebut , reportage+ , plat-fin)>
(plat-d
ebut , (plateau | reportage)+ , plat-fin)>
EMPTY>
titre string >
/*titre-sujet de sommaire */
EMPTY>
titre string >
/*titre-sujet de sommaire */
EMPTY>
titre string
/*titre-sujet de sommaire */
JOU string >
/*chroniqueur */
EMPTY>
titre string
/*titre-sujet de sommaire */
GEN string
/*participant */
r
esum
e string >
EMPTY>
titre string
/*titre-sujet de sommaire */
r
esum
e string >
EMPTY>
titre string
/*titre-sujet de sommaire */
type string >
/*allocution, analyse, d
eclaration, enqu^
ete, entretien,
hommage, portrait, r
eaction, r
ecit, t
emoignage... */
EMPTY>
titre string
/*titre-sujet de sommaire */
AU string
/*journaliste */
GEN string
/*pr
esentateur, commentateur, participant */
type string
/*bande annonce, extrait, micro-trottoir... */
diffusion string /*mode de diffusion : direct, duplex... */
chapeau string >
/*forme, mode de diffusion, ev
enement ou fait traite */
Le magazine composite avec reportages
Les sujets de sommaire listent, dans l'ordre chronologique, les plateaux, les dierents reportages
et, eventuellement les interprogrammes. La pseudo-DTD XML suivante decrit ce qui pourrait ^etre le
schema d'un magazine composite avec reportages :
<!ELEMENT magazine
<!ATTLIST magazine
<!ELEMENT plateau
<!ATTLIST plateau
<!ELEMENT reportage
<!ATTLIST reportage
((plateau | reportage)*)>
REA string
/*r
ealisateur g
en
eral de l'
emission */
PRE string
/*animateurs */
PAR string
/*invit
es plateau s'ils participent a toute l'emission */
chapeau string >
/*si il y a une th
ematique g
enerale */
EMPTY>
titre string
/*titre-sujet de sommaire */
PRE string
/*pr
esentateur */
chapeau string >
/*r
esum
e des interventions des invit
es */
EMPTY>
titre string
/*titre-sujet de sommaire */
14
JOU string
PAR string
production string
chapeau string
r
esum
e string >
/*auteur du sujet */
/*participants eventuels */
/*soci
et
e, copyright du reportage */
/*forme, th
ematique et principaux participants */
/*r
esum
e chronologique des principales s
equences */
Le magazine de sport ou de spectacle est un type particulier de magazine composite. Ainsi, les
regles de decoupage du document obeissent aux m^emes regles. Cependant, la plupart des elements qui
le composent font l'objet d'un traitement normalise.
Le best of
4.3 Les traitements particuliers
La tranche horaire
On entend par tranche horaire un cadre de diusion a periodicite et horaires reguliers deni par
un titre, une thematique et/ou un public specique. La tranche horaire composite est caracterisee par
l'heterogeneite des programmes diuses, la multiplicite des origines de production et la structuration
forte du deroulement chronologique. La description s'eectue au niveau de la tranche horaire et des
emissions incluses. On distingue trois categories principales (Figure 7) :
{ tranche a format recurrent : il s'agit d'une tranche a structure reguliere dont les numeros n'ont
pas de thematique distincte ;
{ tranche a editions thematiques : chaque numero a une thematique distincte ;
{ tranche exceptionnelle : soirees speciales composites organisees autour d'un evenement (Telethon,
hommage ).
Tranche horaire composite
- type de description = 21
- programmes inclus = 12, 22, 32, 42
- forme = code 3
- genre = pas de genre
- titre tranche horaire
Tranche à format récurrent
- type de traitement = catalogage
signalétique
- visionnage = pas de visionnage
- description = sujets de sommaire
Fig.
Tranche exceptionnelle
- type de traitement = indexation
formalle
- visionnage = partiel
- description = sujets de sommaire
- chapeau
- résumé producteur
Tranche à éditions
thématiques
- type de traitement = catalogage
synthétique
- visionnage = pas de visionnage
- description = sujets de sommaire
- résumé producteur
7 { Le traitement documentaire des tranche horaires composites
Autres cas particuliers
Remerciements
Nous tenons a remercier Michele Wautelet, pour les discussions nombreuses et fructueuses qui ont
alimentees la redaction de cette etude.
15
References
[1] Auffret, Gwendal. Structuration de documents audiovisuels et publication electronique - Constitution d'une
cha^
ne editoriale num
erique pour la mise en ligne de collections audiovisuelles. Th
ese de doctorat, Universite
de Technologie de Compiegne, France, Decembre 2000.
[2] Bachimont, Bruno. Indexation audiovisuelle : une problematique en pleine evolution. In L'Objet - Objets
et multimedia, volume 6, nÆ 2, pages 171-191, Edition
Hermes, France, 2000.
[3] Inatheque - Manuel d'indexation. Le traitement documentaire des programmes de radio et de television a
l'Inath
eque. 1996 & mise a jour mars 2001.
16