Audiosculpt 2.3.2 Documentation
Transcription
Audiosculpt 2.3.2 Documentation
AudioSculpt Manuel de l’utilisateur Alain LITHAUD AudioSculpt: Manuel de l’utilisateur par Alain LITHAUD Publié par Karim Haddad Publié le: 2005/03/25 16:34:04 Conception et Développement AudioSculpt: Niels Bogaards. Contributions : Philippe Depalle, Nicholas Ellis, Peter Hanappe, Alain Lithaud, Marc Locascio, David Ralley, Alberto Ricci, Chris Rogers, Xavier Rodet, Hans Tutschku SuperVP: Axel Roebel. Contributions : Philippe Depalle, Gilles Poirot. PM2: Axel Roebel. libsndfile: Erik de Castro Lopo EASDIF/SDIF: Diemo Schwarz, Patrice Tisserand, Fabien Tisserand, Xavier Rodet, Axel Roebel Cette documentation correspond à la version 2.3.2 d’AudioSculpt. AudioSculpt™ est une marque déposée de l’IRCAM. SuperVP™ est une marque déposée de l’IRCAM. pm2™ est une marque déposée de l’IRCAM. OpenMusic™ est une marque déposée de l’IRCAM. Diphone Studio™ est une marque déposée de l’IRCAM. Digi 002™ et Protools LE™ sont des marques déposées de Digidesign. BBEdit Lite™ est une marque déposée de Bare Bones Software Inc. Apple Macintosh™est une marque déposée de Apple Computer, Inc. Copyright © 2005 Ircam. Tous droits réservés. Ce manuel ne doit pas être copié,ni en entier ni partiellement, sans le consentement écrit de l’Ircam. L’utilisation de ce programme et de sa documentation est strictement réservée aux membres des groupes d’utilisateurs de logiciels Ircam. Pour tout renseignement supplémentaire, contactez: Département des Relations Extérieures, Ircam 1 place Igor-Stravinsky F-75004,Paris FRANCE Phone:(33) (1) 44 78 49 62 Fax: (33) (1) 42 77 29 47 Email: [email protected] Veuillez faire parvenir tout commentaire ou suggestion à: K.Haddad Département des Relations Extérieures, Ircam 1 place Igor-Stravinsky F-75004,Paris FRANCE Tel:(33) (1) 44 78 16 05 Email: [email protected] Pour des informations supplémentaires: http://www.forumnet.ircam.fr Table des matières 1 Introduction ......................................................................................................................1 2 Configuration nécessaire ................................................................................................3 3 Installation ........................................................................................................................5 4 Désinstallation..................................................................................................................7 5 Prise en main rapide du logiciel .....................................................................................9 5.1 Lancement d’AudioSculpt .....................................................................................9 5.2 La fenêtre d’AudioSculpt.....................................................................................10 6 Lecture du son ...............................................................................................................15 7 Les sorties son...............................................................................................................17 7.1 Les sorties intégrées ............................................................................................17 7.2 Les cartes son externes .......................................................................................17 8 Fichiers son ....................................................................................................................19 9 Les échelles ....................................................................................................................21 10 Les zooms.....................................................................................................................23 10.1 Manipulation des échelles ..................................................................................23 10.2 La loupe..............................................................................................................23 11 La palette d’outils : "Tools".........................................................................................25 11.1 La palette d’outils................................................................................................25 11.2 Caractères communs à tous les outils................................................................25 11.2.1 Position du pointeur : ..............................................................................25 11.2.2 Jouer un son à partir d’un endroit quelconque : .....................................26 11.2.3 Redimensionner un élément de piste : ...................................................26 11.2.4 Déplacer un élément de piste : ...............................................................26 11.3 L’outil pointeur (ou flèche)...................................................................................26 11.4 L’outil main ..........................................................................................................27 11.5 L’outil curseur de sélection..................................................................................28 11.6 L’outil loupe .........................................................................................................28 11.7 L’outil lasso .........................................................................................................29 11.8 L’outil surface rectangulaire ................................................................................30 11.9 L’outil surface libre ..............................................................................................30 11.10 L’outil crayon .....................................................................................................31 11.11 L’outil diapason .................................................................................................32 11.12 L’outil harmonique.............................................................................................33 11.13 L’outil marqueur ................................................................................................34 12 La palette "Inspector"..................................................................................................35 13 La palette "Sonogram Display"...................................................................................37 14 Position du curseur......................................................................................................39 15 Sélection d’une partie du son .....................................................................................41 16 Les analyses .................................................................................................................43 16.1 Les paramètres généraux d’analyse ..................................................................43 16.2 "Sonogram Analysis" : le sonagramme ..............................................................43 16.3 "Fundamental Analysis" : Analyse de la fréquence fondamentale (F0)..............47 16.4 "Partial Tracking Analysis" : Analyse en suivi de partiels ...................................49 16.4.1 L’analyse inharmonique ..........................................................................50 16.4.2 L’analyse harmonique .............................................................................51 16.5 "Chord Sequence Analysis" : Analyse en séquence d’accords ..........................52 v 16.5.1 "Average Spectrum"................................................................................54 16.5.2 "Inharmonic Partial Averging" .................................................................54 16.6 Les marqueurs obtenus par analyse ..................................................................55 16.7 "Peak Detection" : détection des pics .................................................................56 16.8 "Masking Effects"................................................................................................57 17 Les marqueurs : "Markers" .........................................................................................59 17.1 Les marqueurs manuels ("Hand Markers").........................................................59 17.2 Les marqueurs automatiques .............................................................................59 17.3 Les marqueurs de "Chord Sequence Analysis. . . " .............................................60 17.4 Couleur des marqueurs ......................................................................................61 17.5 Points communs à tous les marqueurs...............................................................62 17.5.1 Sélection des marqueurs ........................................................................62 17.5.2 Déplacement (édition) des marqueurs....................................................62 17.5.3 Suppression de marqueurs.....................................................................62 17.5.4 Sauvegarde des marqueurs....................................................................62 17.5.5 Ouverture de fichiers de marqueurs sauvegardés..................................63 18 Spectre et diapason .....................................................................................................65 19 Définition et paramètres des traitements ..................................................................67 19.1 Généralités .........................................................................................................67 19.1.1 Les traitements dits "à paramètres constants"........................................67 19.1.2 Les traitements dits "par Bpf"..................................................................68 19.1.3 Affichage des traitements .......................................................................68 19.2 Filtrage par surface.............................................................................................69 19.2.1 Surface rectangulaire ..............................................................................69 19.2.2 Surface libre ............................................................................................72 19.2.3 Le crayon ................................................................................................74 19.2.4 Points communs à toutes les surfaces (rectangle, libre et crayon) .........75 19.2.4.1 Rappel .........................................................................................75 19.2.4.2 Sélection de plusieurs surfaces...................................................75 19.2.4.3 Suppression de plusieurs surfaces .............................................75 19.2.4.4 Déplacement de surfaces............................................................76 19.2.4.5 Duplication de surfaces ...............................................................76 19.2.4.6 Redimensionnement de surfaces ................................................76 19.2.4.7 Gain.............................................................................................76 19.2.4.8 Chevauchement de surfaces.......................................................77 19.2.4.9 "Replicate in Frequency. . . " ........................................................77 19.2.4.10 "Replicate in Time. . . " ...............................................................78 19.2.4.11 "Expand To Markers".................................................................79 19.2.4.12 "Expand To Grid" .......................................................................79 19.2.4.13 "Invert".......................................................................................79 19.2.4.14 "Glisser-déposer" ("Drag and Drop") .........................................79 19.3 Les autres traitements "à paramètres constants" ...............................................80 19.3.1"Constant Transposition" : transposition invariable dans le temps ...........80 19.3.2 "Constant TimeStretching" : dilatation/compression à facteur constant..82 19.3.3"Freeze" : gel du son en un point .............................................................83 19.3.4 "Reverse/Repeat" : lecture en avant et/ou en arrière avec répétition......84 19.3.5 "Constant Formant Filter" : filtre formantique ..........................................85 19.3.6 "Band Filter" : filtre par bande .................................................................85 19.3.7 "Clipping Filter" : filtre par "Clipping" .......................................................87 19.3.8 "Image Filter" : filtrage par une image.....................................................88 19.4 Les traitements dits "par Bpf" .............................................................................89 vi 19.4.1 L’éditeur de Bpf .......................................................................................89 19.4.2 "Dynamic Transposition" : transposition variable dans le temps .............90 19.4.3 "Dynamic TimeStretching" : dilatation/compression ...............................91 19.4.4 "Breakpoint for Gain" : modification du gain variable dans le temps.......91 19.4.5 "Breakpoint Filter" : filtre par Bpf.............................................................92 19.4.6 "Dynamic Formant" : filtre formantique variable......................................93 19.5 Points communs à tous les traitements ..............................................................93 19.5.1 Normalisation ..........................................................................................93 19.5.2 Remarque importante .............................................................................93 19.5.3 Rappel.....................................................................................................93 19.5.4 Sélection de plusieurs traitements ..........................................................94 19.5.5 Suppression de plusieurs traitements.....................................................94 19.5.6 Déplacement de traitements ...................................................................94 19.5.7 Duplication de traitements ......................................................................94 19.5.8 Redimensionnement de traitement .........................................................94 19.5.9 "Replicate in Time. . . ".............................................................................94 19.5.10 "Expand To Markers" ............................................................................95 19.5.11 "Expand To Grid"...................................................................................95 19.5.12 "Invert" ..................................................................................................95 19.5.13 "Glisser-déposer" ("Drag and Drop").....................................................95 19.5.14 Traitements multiples ............................................................................96 19.5.15 Sauvegarde et utilisation de fichiers sauvegardés................................96 19.6 Points communs à toutes les transpositions.......................................................96 19.6.1 Préservation des transitoires ..................................................................97 19.6.2 Correction temporelle..............................................................................97 19.6.3 Enveloppe spectrale................................................................................97 20 Sons multicanaux.........................................................................................................99 20.1 Sons stéréophoniques ou bicanaux ...................................................................99 20.2 Sons multicanaux (autres que stéréophoniques ou bicanaux) .........................100 21 Le séquenceur............................................................................................................101 21.1 La zone du séquenceur ....................................................................................101 21.2 Les pistes du séquenceur.................................................................................101 22 La grille : "Grid" .........................................................................................................105 23 Les autres traitements...............................................................................................107 23.1 "Source Filter Synthesis" : synthèse croisée par source/filtre ..........................107 23.2 "Generalized Cross Synthesis" : synthèse croisée généralisée .......................109 23.3 Normalisation....................................................................................................110 23.4 Samplerate Conversion ....................................................................................110 24 Les consoles ..............................................................................................................113 24.1 La console intégrée ..........................................................................................113 24.2 La console vide : "New Console"......................................................................113 25 Calcul des traitements : "Processing" .....................................................................115 25.1 Calcul sur la totalité du son : "Process Treatments . . . " ...................................115 25.1.1 Paramètres de l’analyse : "FFT Settings" .............................................115 25.1.2 Paramètres de la synthèse : "Synthesis Settings" ................................116 25.2 Calcul sur une partie du son : "Process Selection. . . "......................................116 25.3 Les fichiers temporaires ...................................................................................117 25.4 Session de travail .............................................................................................117 vii 26 Interruption d’un calcul .............................................................................................119 27 Détection et préservation des transitoires ..............................................................121 28 Mode "Temps réel" : "Realtime mode" ....................................................................123 29 Sauvegarde des fichiers ............................................................................................125 30 Format des fichiers ....................................................................................................127 30.1 Les différents formats .......................................................................................127 30.2 Les fichiers SDIF ..............................................................................................127 31 Les menus ..................................................................................................................129 31.1 Menu "File" .......................................................................................................129 31.2 Menu "Edit" .......................................................................................................130 31.3 Menu "Analysis"................................................................................................131 31.4 Menu "Treatments" ...........................................................................................132 31.5 Menu "Processing" ...........................................................................................133 31.6 Menu "Window" ................................................................................................133 31.7 Menu "Bpf"........................................................................................................134 32 Les lignes de commandes ........................................................................................137 33 Annexes ......................................................................................................................139 33.1 SuperVP -ha .....................................................................................................139 33.2 SuperVP -hf ......................................................................................................157 viii 1 Introduction AudioSculpt est un puissant outil d’analyse et de traitement des sons. AudioSculpt permet d’effectuer diverses analyses sur un son, d’en stocker les résultats dans des fichiers au format SDIF (ou texte, selon les cas), exploitables par d’autres logiciels. Le format SDIF peut être converti en texte (et inversement) au moyen des "Droplets" qui accompagnent AudioSculpt. Certains résultats d’analyse peuvent être visualisés par affichage sur le sonagramme. AudioSculpt permet de définir et d’appliquer différents traitements sur un son : filtrages divers, dilatation, compression, transposition. . . et de gérer ceux-ci à l’aide d’un séquenceur de traitements. AudioSculpt peut travailler avec des sons monophoniques, aussi bien qu’avec des sons multicanaux. Il accepte les formats AIFF, SDII et WAV, en 8,16, 24,32 bits jusqu’à 192 kHz. Il sait utiliser les fichiers en "flottant" AIFC et WAV en 32 bits. 1 1 Introduction 2 2 Configuration nécessaire AudioSculpt 2.3 est une application développée pour MacIntosh. Elle requiert, au minimum, le système Mac OS X 10.3 (Panther). La rapidité des calculs et la possibilité de lecture de traitements en temps réel dépend du processeur et de sa vitesse, ainsi que de la quantité de mémoire vive. L’espace libre nécessaire sur le disque dur dépend du travail effectué. Rappel : un fichier contenant 1 minute de son stéréo (16 bits, 44100 Hz) a une taille d’environ 10 Mo. Il faut cependant tenir compte de la taille des fichiers temporaires : la taille d’un fichier FFT est environ le double de celle du son avec les paramétrages courants. AudioSculpt travaille avec "CoreAudio" et peut donc utiliser en sortie différentes cartes son. La version courante est 2.3.2. La dernière version compatible Mac OS9 et Mac OS X est AudioSculpt-2.0.4b. Note : Vous pouvez discuter d’AudioSculpt et de ses applications en vous inscrivant à la liste des utilisateurs (langues anglaise et française supportées) à l’adresse suivante : http://listes.ircam.fr/wws/lists/english_private 3 2 Configuration nécessaire 4 3 Installation Il suffit de monter l’image disque (.dmg) et de copier le dossier "AudioSculpt 2.3" à l’endroit où vous le souhaitez sur votre disque dur. Ce dossier contient les éléments suivants : • AudioSculpt 2.3.app : l’application elle-même. • Documentation : dossier contenant la... documentation. • Droplets : dossier contenant différents droplets (et les kernels correspondants) permettant, entre autres, les conversions "SDIF<>Texte". • Fft : dossier vide qui permet à l’application de ranger les fichiers Fft temporaires ou non. • Fundamental : dossier vide qui permet à l’application de ranger des fichiers temporaires ou non. • Kernels : dossier qui contient les noyaux (SuperVP, Super Vocoder de Phases, et pm2, moteur de synthèse additive) de l’application ainsi que des documents indispensables au fonctionnement de l’application. • Markers : dossier vide qui permet à l’application de ranger les fichiers concernant les "marqueurs". • Sounds : dossier contenant, à titre d’exemple, le fichier son "africa.aiff" et dans lequel on peut ranger les sons. • SpectralEstimates : dossier vide qui permet à l’application de ranger les fichiers SDIF d’estimations spectrales. • Temp : dossier vide qui permet à l’application de ranger des fichiers temporaires. • Treatments : dossier vide qui permet à l’application de ranger des fichiers de traitements. Il est très important de ne déplacer aucun de ces dossiers ou documents sauf "Documentation" et "Droplets" sous peine de non-fonctionnement d’AudioSculpt. Lors du premier lancement, AudioSculpt ouvre une fenêtre vous invitant à rentrer votre nom et votre code : respectez scrupuleusement les indications données dans la lettre accompagnant le CD-Rom. Note : En cas de problème, si une version antérieure d’AudioSculpt était installée, il convient de jeter les préférences : fichier "AudioSculpt 2 Prefs" qui se trouve dans le dossier "Preferences" contenu dans le dossier "Library" de votre compte (votre maison). Important : Le nom des fichiers (son ou autres) ne doit pas comporter de "/", de caractères accentués ou autres caractères diacritiques. 5 3 Installation 6 4 Désinstallation La désinstallation est fort simple : il suffit de glisser le dossier contenant l’application à la poubelle et de la vider. Vous pouvez éventuellement jeter le fichier "AudioSculpt 2 Prefs" et qui se trouve dans le dossier "Preferences", contenu dans le dossier "Library" de votre compte (votre maison). 7 4 Désinstallation 8 5 Prise en main rapide du logiciel 5.1 Lancement d’AudioSculpt AudioSculpt se lance de manière classique : soit en double-cliquant sur l’application, soit en glissant-déposant un son sur celle-ci. Dans le premier cas, AudioSculpt s’ouvre avec les fenêtres (palettes flottantes) cochées dans le menu "Window" ("Tools", "Inspector", "Sonogram Display", "Grid Settings"). Reportez vous à la section 31.6. Note : La touche "tabulation" permet de masquer ou de montrer tour à tour ces palettes. Puis, allez dans le menu "File" et faites "Open...". Dans la fenêtre de dialogue standard choisissez un son. 9 5 Prise en main rapide du logiciel La fenêtre principale d’AudioSculpt, portant le nom du son se présente ainsi : En glissant-déposant un son sur l’application, cette fenêtre s’ouvre directement. Vous pouvez ouvrir un son précédemment utilisé en le choisissant dans le sous-menu proposé par l’item "Open recent" du menu "File". 5.2 La fenêtre d’AudioSculpt Cette fenêtre est redimensionnable de la manière habituelle (case, en bas, à droite). En haut, à gauche, vous lisez les informations sur le son ouvert (taux d’échantillonnage, résolution de la quantification, format, durée, nombre de canaux). A droite, se trouvent quatre 10 5 Prise en main rapide du logiciel boutons concernant la lecture du son, suivis de quatre champs éditables renseignant la position du curseur et la sélection. Reportez vous aux sections 6, 14 et 15. La zone 1 (zone supérieure) montre le son (représentation en forme d’onde) dans son entier. S’il s’agit d’un son multicanal, la somme des canaux est affichée. Le cadre rouge représente la partie du son visible dans la zone 2. Pour jouer le son, appuyez sur la barre d’espace et pour arrêter, appuyez de nouveau sur ladite barre. Vous pouvez utiliser le troisième bouton de la partie supérieure de la fenêtre. Pour plus de détails, reportez vous à la section 6. La zone 2 est la "fenêtre dans le son" : elle permet de naviguer dans le son à l’aide des zooms. A noter qu’au départ, elle montre le son dans sa totalité. 11 5 Prise en main rapide du logiciel La zone 3 est l’endroit où s’afficheront le sonagramme ainsi que le spectre, à droite. La zone 4 est celle du séquenceur : c’est un ensemble de pistes sur lesquelles seront disposés les traitements. La zone 5 est repliée au départ (voir plus bas) et indique "Ready" : c’est la console SuperVP, où s’inscrivent les lignes de commande et les commentaires générés par SuperVP ou pm2. Cette console est propre au son ouvert. Note : Les zones 2,3 et 4 sont chacune munies d’un axe des temps horizontal identique. Elles sont synchronisées et vous pouvez vous y déplacer grâce à "l’ascenseur" horizontal qui se trouve en bas de la fenêtre et qui apparaît lorsqu’on a zoomé à l’intérieur du son. Toutes les zones comportent un petit triangle qui permet de les replier (ou de les déplier). 12 5 Prise en main rapide du logiciel Les zones 1,2 et 3 peuvent être redimensionnées en hauteur : amenez le pointeur sur la barre située entre deux zones. Puis cliquez, le pointeur se transforme et vous permet de la monter ou de la descendre. La même fonction existe pour régler les largeurs respectives du sonagramme et du spectre. Note : Si vous étirez le sonagramme jusqu’à l’extrémité droite, vous voyez la barre uniquement dans l’échelle temporelle, sous l’échelle fréquentielle. 13 5 Prise en main rapide du logiciel 14 6 Lecture du son Pour jouer le son, appuyez sur la barre d’espace et pour arrêter, appuyez de nouveau sur ladite barre. Le déplacement du curseur est représenté par un trait rouge sur toutes les zones et la position est indiquée dans le champ en haut de la fenêtre. Reportez vous à la section 14. Si une partie du son est sélectionnée, seule cette partie est jouée. En haut de la fenêtre principale se trouvent 3 boutons dédiés à la lecture : Un clic sur le premier bouton replace le curseur au début du son ou de la sélection, un second clic le ramène au début du son (si sélection il y a), mais seule la sélection sera jouée (raccourci clavier : "Return"). Le second bouton : "Play/Stop" a la même fonction que la barre d’espace. Le troisième bouton propose la lecture en boucle de la sélection (ou du son si rien n’est sélectionné). Pour jouer le son depuis un endroit quelconque, il faut supprimer la sélection en cliquant sur le sonagramme avec l’outil curseur (reportez vous aux sections 11.1 et 15). Le son sera joué à partir de cette nouvelle position du curseur. Pour jouer depuis le début, il suffit de ramener le curseur au début grâce au premier bouton décrit ci-dessus. Il est possible de positionner le curseur à tout endroit désiré (reportez vous à la section 14). En positionnant n’importe quel outil (sauf l’outil main) dans la zone 1 (totalité du son), celui-ci prend la forme d’un haut-parleur muni d’un trait vertical (reportez vous à la section 11.2.2). Il est donc possible, en cliquant, de jouer à partir de n’importe quel endroit. Si vous avez zoomé dans le son, l’item "Follow Playback" du menu "Window" permet le défilement de "la fenêtre dans le son" pour suivre le déplacement du curseur. Si cet item est décoché, "la fenêtre dans le son" reste fixe. 15 6 Lecture du son 16 7 Les sorties son 7.1 Les sorties intégrées AudioSculpt peut utiliser les sorties son du Mac. Dans ce cas : • les sons monophoniques sont joués en monophonie sur les deux sorties du Mac, • les sons stéréophoniques (ou bicanaux) sont joués en stéréophonie sur les deux sorties (gauche et droite) du Mac, • pour les sons multicanaux (autres que stéréophoniques ou bicanaux), seuls les deux premier canaux sont joués en stéréophonie sur les deux sorties (gauche et droite) du Mac. 7.2 Les cartes son externes AudioSculpt travaille avec "CoreAudio" et peut donc utiliser en sortie différentes cartes son. L’utilitaire Apple "Audio MIDI Setup" ("Configuration audio et MIDI") (dans le dossier "Utilitaires" qui se trouve dans le dossier "Applications") doit être réglé pour utiliser cette carte. Note : il est possible que le "driver" de cette carte demande en plus d’autres réglages. Par exemple, avec la "Digi 002" (Digidesign) ET la version 6.4 de Protools LE, il faut lancer l’utilitaire "Digidesign CoreAudio Setup" (qui se trouve dans le dossier "Digidesign") et ajouter l’application "AudioSculpt" dans "Supported Applications. . . ". A noter que "Digidesign CoreAudio Setup" ne reconnaît pas SuperVP comme application, donc "le mode temps réel" fonctionnera sur les sorties son intégrés du Mac. 17 7 Les sorties son 18 8 Fichiers son AudioSculpt peut travailler avec des sons monophoniques, aussi bien qu’avec des sons multicanaux. Il accepte les formats AIFF, SDII et WAV, en 8,16, 24,32 bits jusqu’à 192 kHz. AudioSculpt sait utiliser les fichiers en "flottant" AIFC et WAV en 32 bits. 19 8 Fichiers son 20 9 Les échelles Il vous est possible de choisir certaines échelles pour la fenêtre AudioSculpt ou les Bpf. En faisant un "Contrôle+clic" sur une échelle, vous ouvrez un menu contextuel vous proposant éventuellement un choix. • Échelle des temps pour le son, pour le sonagramme, pour les pistes du séquenceur ainsi que pour les Bpf concernant la transposition, la dilatation/compression ou le gain : L’échelle de temps choisie pour une zone de la fenêtre AudioSculpt est valable pour toutes les zones. L’échelle de temps choisie pour une Bpf n’est valable que pour celle-ci. • Échelle des fréquences pour le sonagramme et le spectre ensemble, ainsi que pour la Bpf "Breakpoint Filter" : 21 9 Les échelles 22 • Échelle de transposition (transposition par Bpf) : • Échelle des amplitudes : linéaire pour la "fenêtre dans le son" et logarithmique (en dB) pour le spectre ainsi que pour les Bpf "Breakpoint Filter" et "Gain". Il n’y a pas de choix. 10 Les zooms Ces manipulations sont valables pour toutes les échelles (horizontales et verticales de la fenêtre AudioSculpt et des Bpf). 10.1 Manipulation des échelles En plaçant le pointeur sur une valeur quelconque de n’importe quelle échelle, tout en maintenant le bouton de la souris enfoncé, il suffit de déplacer la souris vers la droite pour faire un agrandissement autour de cette valeur (vers la gauche, pour rétrécir). La même manipulation en enfonçant la touche "Pomme" ("commande") fait varier le zoom à partir de la valeur la plus à gauche de la fenêtre. En plaçant n’importe quel outil sur une valeur quelconque de n’importe quelle échelle et maintenant le bouton de la souris enfoncé un moment, l’échelle s’étend continûment de plus en plus autour de cette valeur jusqu’au relâchement du bouton de la souris. Un double-clic sur une règle permet de revenir à la dimension initiale. 10.2 La loupe La loupe (voir section 11.6) permet de sélectionner une partie du sonagramme (et/ou du spectre) ou du son ("fenêtre dans le son") et de l’agrandir à la taille de la fenêtre. Un doubleclic dans le sonagramme ou sur une règle permet de revenir à la dimension initiale. L’outil loupe a la particularité de devenir négatif : en appuyant sur la touche "Option" ("alt") vous faites le contraire, c’est-à-dire un zoom arrière. Un double-clic sur une échelle fait revenir à la dimension initiale. En positionnant la loupe sur la "fenêtre dans le son" ou sur le sonagramme (ou le spectre) et en faisant "Option+clic" ("alt+clic"), la loupe devient négative et l’on effectue un zoom arrière par saut centré sur sa position. À partir du moment où vous avez zoomé dans le son ou le sonagramme, le rectangle rouge de la zone supérieure délimite la portion de son visible dans la zone 2. 23 10 Les zooms Placer l’outil main (voir section 11.4) sur ce rectangle rouge et maintenir le bouton de la souris enfoncé permet de le déplacer et donc de voyager dans le son et le sonagramme. L’outil main permet de saisir l’image du sonagramme et de la déplacer en tout sens dans sa fenêtre (l’affichage de la "fenêtre dans le son" suivra). L’outil main permet de saisir l’image de la Bpf et de la déplacer en tout sens dans sa fenêtre. Dans le menu "Window", l’item "Optimize Sonogram" permet d’afficher plein écran le sonagramme et la "fenêtre dans le son" (zones 2 et 3), et de revenir à la taille initiale. Le raccourci clavier correspondant est "Pomme+U" ("commande+U"). 24 11 La palette d’outils : "Tools" 11.1 La palette d’outils La palette d’outils apparaît si vous avez coché "Show Tools" dans le menu "Window" (il est conseillé de cocher cette option une fois pour toute). La touche "tabulation" permet de masquer ou de montrer tour à tour cette palette ainsi que celles des trois autres ("Inspector", "Sonogram Display", "Grid Settings") qui sont cochées. La position du pointeur apparaît à droite, dans la barre d’outils et il est possible de la "fixer" en appuyant sur la touche "f", ce qui permet de la copier puis de la coller ailleurs (voir section 11.2.1). Des raccourcis claviers permettent de naviguer rapidement d’un outil à un autre : • a = outil pointeur flèche (Arrow), • h = outil main (Hand), • b = curseur de sélection (Beam - for selection), • z = outil loupe (Zoom), • l = outil lasso (Lasso), • s = outil surface rectangulaire (Surface), • r = outil surface libre (Region), • e = outil crayon (pEncil), • d = outil diapason (Diapason), • c = outil harmonique (harmoniC), • m = outil marqueur (Marker). Si on laisse le pointeur sur l’un des outils son nom et son raccourci clavier apparaît (c’est un "Help tags" comme dans bien d’autres logiciels). En enfonçant la touche "Pomme" (ou "commande") une description plus complète apparaît si elle est disponible. 11.2 Caractères communs à tous les outils 11.2.1 Position du pointeur : La position du pointeur apparaît dans la barre d’outils (à droite de ceux-ci) et il est possible de la "fixer" en appuyant sur la touche "f", ce qui permet de la copier puis de la coller ailleurs. Zone 1 (zone supérieure, montrant le son dans son entier) : t en secondes. Zone 2 (fenêtre dans le son) : t en secondes et v amplitude linéaire. 25 11 La palette d’outils : "Tools" Zone 3 : • sur le sonagramme : t en secondes et f en Hz, et si le sonagramme est affiché, v en dB, • sur le spectrogramme : v en dB et f en Hz. Zone 4 (les pistes du séquenceur) : t en secondes. 11.2.2 Jouer un son à partir d’un endroit quelconque : En positionnant le pointeur (n’importe lequel, sauf l’outil main) dans la zone 1 (zone supérieure, montrant le son dans son entier), celui-ci prend la forme d’un haut-parleur muni d’un trait vertical. Il est donc possible, en cliquant, de jouer à partir de n’importe quel endroit. Le déplacement est représenté par un trait rouge sur toutes les zones et la position est indiquée dans le champ en haut de la fenêtre AudioSculpt. 11.2.3 Redimensionner un élément de piste : En positionnant n’importe quel outil (sauf l’outil marqueur) à une extrémité d’un élément de piste, celui-ci se transforme en deux petits triangles noirs. Puis en cliquant, vous pouvez étirer ou réduire l’élément horizontalement. 11.2.4 Déplacer un élément de piste : En positionnant n’importe quel outil (sauf l’outil marqueur) sur un élément de piste et en cliquant, vous pouvez déplacer horizontalement un élément de piste (ou plusieurs, s’ils sont sélectionnés). 11.3 L’outil pointeur (ou flèche) Cet outil a plusieurs fonctions, selon les zones ou les objets : 26 11 La palette d’outils : "Tools" • Sur la zone 1 (zone supérieure, montrant le son dans son entier), il se transforme en petit haut-parleur muni d’un trait vertical et permet de jouer le son à partir de n’importe quel endroit (voir sections 6 et 11.2.2). • Sur la zone 2 (fenêtre dans le son), il permet (en cliquant) de sélectionner une partie du son. • Sur la zone 3 (sonagramme), il permet de déplacer un marqueur (en cliquant) sur le triangle supérieur de celui-ci). Il est possible de redimensionner un traitement (le curseur se transforme en deux petits triangles noirs à chaque extrémité du traitement ; en cliquant, vous pouvez changer la position de début ou de fin). • Sur la zone 3 (sonagramme), il se transforme en deux petits triangles noirs lorsqu’on se positionne sur l’un des bords d’une surface rectangulaire ou trait de crayon et permet ainsi, en cliquant, de redimensionner horizontalement (en durée) ou verticalement (en fréquence) cette surface. • Sur la zone 3 (sonagramme), il permet aussi de sélectionner (par rectangle) un ou plusieurs traits de crayon. • Sur la zone 4 (les pistes du séquenceur) : il permet de redimensionner ou de déplacer d’un élément de piste horizontalement (voir sections 11.2.3 et 11.2.4). 11.4 L’outil main L’outil main permet : • de déplacer le rectangle rouge de zoom de la zone 1. • de saisir l’image du sonagramme et de la déplacer en tout sens dans sa fenêtre (l’affichage de la "fenêtre dans le son", du spectre et des pistes suivront). Si vous avez zoomé, vous pouvez faire cette manipulation horizontalement en saisissant l’image du son dans la "fenêtre dans le son". • de saisir et de déplacer en tout sens n’importe quelles surfaces posées sur le sonagramme (rectangle, libre et crayon). Il faut, pour cela, que l’une d’elles (ou plusieurs) soient sélectionnées sur les pistes du séquenceur. Si aucune ne l’est, c’est l’image du sonagramme qui sera déplacée. Cet outil permet aussi, sur la zone 4 (pistes du séquenceur), le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 27 11 La palette d’outils : "Tools" 11.5 L’outil curseur de sélection L’outil curseur de sélection permet de sélectionner (en cliquant) une partie du son dans les zones 2 (fenêtre dans le son) et 3 (sonagramme). Un double-clic dans la zone 2 sélectionne tout le son. Cet outil permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.6 L’outil loupe L’outil loupe définit, sur les zones 2 et 3, le rectangle sur lequel on désire faire un zoom : amplitude-durée (zone 2), fréquence-durée (zone 3, sonagramme), fréquence (zone 3, spectrogramme). Un double-clic sur une règle horizontale ou verticale annule les zooms correspondant (voir section 10.2). Cet outil permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.7 L’outil lasso 28 11 La palette d’outils : "Tools" L’outil lasso permet de sélectionner plusieurs surfaces sur le sonagramme (il n’est pas nécessaire de les englober totalement). Sur la zone 2 (fenêtre dans le son), il permet de sélectionner une partie du son. Cet outil permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.8 L’outil surface rectangulaire L’outil surface rectangulaire permet de dessiner une surface rectangulaire de filtrage sur le sonagramme (zone 3). 29 11 La palette d’outils : "Tools" Sur la zone 2 (fenêtre dans le son), il permet de sélectionner une partie du son. Cet outil permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.9 L’outil surface libre L’outil surface libre permet de dessiner une surface de filtrage sur le sonagramme (zone 3) : soit point par point (surface polygonale), soit à main levée. Surface point par point (surface polygonale) : il faut placer le pointeur à l’endroit voulu, puis cliquer pour définir le premier point, ensuite déplacer le pointeur (tirer un segment à partir de ce point) et cliquer pour poser le point suivant et ainsi de suite. Un double-clic referme automatiquement la surface. Surface à main levée : il faut placer le pointeur à l’endroit voulu, puis, en maintenant enfoncé le bouton de la souris, tracer le contour (en relâchant le bouton de la souris, la surface se referme automatiquement par un segment). 30 11 La palette d’outils : "Tools" Sur la zone 2 (fenêtre dans le son), il permet de sélectionner une partie du son. Cet outil permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.10 L’outil crayon L’outil crayon permet de dessiner librement sur le sonagramme pour déterminer une région de filtrage. L’épaisseur du trait se choisit en cliquant sur le petit triangle noir à droite de l’outil dans la palette. Les valeurs d’utilisateur sont réglables dans les préférences. Par défaut, l’épaisseur est de 6 pixels et le gain de -50 dB (atténuation). 31 11 La palette d’outils : "Tools" Sur la zone 2 (fenêtre dans le son), l’outil crayon permet de sélectionner une partie du son. Cet outil permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.11 L’outil diapason L’outil diapason n’est pleinement fonctionnel que si le sonagramme du son est affiché. La partie sensible du diapason est la petite boule située à sa base. Amplitude, fréquence et position temporelle sont indiquées dans la partie droite de la palette d’outils, tandis que le spectrogramme correspondant s’affiche en bleu. En cliquant, un son sinusoïdal pur est joué avec la fréquence et l’amplitude correspondant au point cliqué sur le sonagramme. 32 11 La palette d’outils : "Tools" Sur la zone 2 (fenêtre dans le son), l’outil diapason permet de sélectionner une partie du son. Il permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.12 L’outil harmonique L’outil harmonique permet de déterminer visuellement les harmoniques sur le sonagramme (il n’est utile que si le sonagramme est affiché). Sur la zone 2 (fenêtre dans le son), cet outil permet de sélectionner une partie du son. 33 11 La palette d’outils : "Tools" Il permet aussi : sur la zone 1, la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2), et sur la zone 4 (pistes du séquenceur) le redimensionnement ou le déplacement d’éléments de piste (voir sections 11.2.3 et 11.2.4). 11.13 L’outil marqueur L’outil marqueur permet de poser un marqueur (dits manuels, "Hand Added Markers") en cliquant à l’endroit voulu sur la zone 3 (zone du sonagramme), aussi bien que sur la zone 2 (fenêtre dans le son) ou sur les pistes du séquenceur). Lors de la lecture, le raccourci clavier "t" (reportez vous à la section 31.1) permet de les poser au vol. Sur la zone 1, il permet la lecture du son à partir de n’importe quel endroit (voir sections 6 et 11.2.2). 34 12 La palette "Inspector" Cette palette flottante ne s’ouvre que si l’item "Show Inspector" est coché dans le menu "Window". La touche "tabulation" permet de masquer ou de montrer tour à tour cette palette ainsi que celles des trois autres ("Palette d’outils ("Tools")", "Sonogram Display", "Grid Settings") qui sont cochées. Le raccourci clavier "Pomme+I" ("commande+I") affiche ou cache la palette "Inspector" à volonté. Elle affiche les informations concernant un seul élément sélectionné sur une piste. Si rien n’est sélectionné, elle n’affiche rien d’autre que "AudioSculpt". Lorsque plusieurs traitements (ou marqueurs) sont sélectionnés, elle renseigne sur le dernier sélectionné. Si vous désirez les informations sur un autre traitement (ou marqueur) de cet ensemble (et éventuellement modifier ce qui peut l’être), sans pour autant perdre cette sélection, il suffit de cliquer sur l’élément de piste (ou marqueur) voulu en maintenant la touche "shift" (majuscule temporaire) enfoncée. Cette palette est très utile pour intervenir directement sur les paramètres d’un objet "traitement" ou sur la position d’un marqueur. Pour modifier la valeur d’un paramètre, il suffit de cliquer dans le champ de celle-ci pour la sélectionner, puis de taper la nouvelle valeur et de valider par "return" ou "enter" (ou encore en cliquant ailleurs). Il est ainsi très simple de positionner et dimensionner précisément un objet, en donnant deux paramètres sur trois : temps de début ("Start"), temps de fin ("End"), ou durée ("Duration"). Note : Il faut, bien sûr, être vigilant et ne pas vouloir entrer de valeurs incohérentes comme, par exemple, un temps de début ("Start") inférieur à un temps de fin ("End"). Le changement sera refusé. Cette palette donne accès à tous les paramètres d’un objet, mais certains d’entre eux ne sont évidemment pas modifiables : ils sont en italique. Par exemple, pour les traitements par Bpf, la variable est marquée "dynamic" et ne peut être modifiée. Certains champs peuvent être simplement "inversables" entre "on" et "off" par un simple clic ("Time Correction", par exemple, pour une transposition). 35 12 La palette "Inspector" Note : La palette "Inspector" ne renseignant que sur un seul objet, ne permet de modifier les paramètres que de ce seul objet. 36 13 La palette "Sonogram Display" Cette palette flottante ne s’ouvre que si l’item "Sonogram Display" est coché dans le menu "Window". La touche "tabulation" permet de masquer ou de montrer tour à tour cette palette ainsi que celles des trois autres ("Palette d’outils ("Tools")", "Inspector", "Grid Settings") qui sont cochées. Un raccouci clavier "Pomme+J" ("commande+J") affiche ou cache la palette "Sonogram Display" à volonté. Elle permet de montrer ou de masquer ou de modifier l’affichage dans la zone 2 (la zone du sonagramme). Ce qu’elle propose est fonction des analyses faites ainsi que de l’existence de marqueurs manuels posés et de traitements. Si aucune analyse n’a été faite, si aucun traitement n’a été défini, si aucun marqueur manuel n’a été posé, elle ne montre rien. Chaque case (et éventuellement le ou les curseurs horizontaux associés) ne s’affiche que si l’élément correspondant a été calculé ou défini. Si un sonagramme est affiché, deux potentiomètres linéaires horizontaux permettent de régler son affichage en niveau de gris (voir section 16.2) : Les réglages par défaut sont : -10 dB pour le noir ("Black Threshold") et -60 dB pour le blanc ("White Threshold"). 37 13 La palette "Sonogram Display" Chaque type de marqueurs générés par analyse dispose d’un potentiomètre linéaire réglant le seuil d’affichage (voir section 17). 38 14 Position du curseur Le curseur se place, par défaut, au début du son, s’il n’y a pas de sélection. Dans le cas contraire, il se place au début de la sélection. Le curseur peut se trouver n’importe où, si la lecture a été arrêtée en cours de route. En haut, à droite de la fenêtre principale, le premier champ indique la position du curseur (en lecture ou à l’arrêt). Mais, il est facile de choisir la position du curseur. Manuellement, il suffit de saisir le triangle supérieur du curseur avec n’importe quel outil (sauf outil loupe, outil diapason et outil marqueur, voir section 11), de cliquer et de le déplacer jusqu’à l’endroit voulu. Une autre méthode consiste à rentrer la valeur de la position temporelle voulue dans le premier champ éditable situé dans la partie supérieure de la fenêtre AudioSculpt, à droite, et de valider avec la touche "enter" ou "return" (ou encore en cliquant ailleurs). 39 14 Position du curseur Avec l’outil pointeur, il suffit de cliquer à l’endroit voulu sur la zone de la fenêtre dans le son (zone 2). Une sélection préalablement définie n’est pas affectée par le changement de position du curseur. Avec l’outil curseur de sélection (voir section 11.5), il suffit de cliquer à l’endroit voulu sur la zone du sonagramme (zone 3). Mais dans ce cas, vous perdez la sélection. 40 15 Sélection d’une partie du son La sélection se fait généralement à l’aide d’un outil (voir section 11). L’outil dédié à cela est l’outil curseur de sélection utilisable sur les zones 2 (fenêtre dans le son) et 3 (zone du sonagramme). Un double-clic dans la zone 2 sélectionne tout le son. Les outils pointeur, lasso, surface rectangulaire, surface libre, diapason ainsi qu’outil harmonique sont utilisables de la même manière, mais uniquement sur la fenêtre dans le son (zone 2). Les valeurs de la sélection (ainsi que la position du curseur) apparaissent dans la partie supérieure droite de la fenêtre AudioSculpt. Les 4 champs indiquent (respectivement de gauche à droite) : • la position du curseur (en lecture ou à l’arrêt), • le début et la fin de la sélection (s’il y en a une), • la durée de cette sélection (s’il y en a une). Ce sont des champs éditables, il est donc possible de définir la sélection en entrant 2 des valeurs sur les 3 (début, fin, durée). Pour modifier la valeur d’un paramètre, il suffit de cliquer sur celle-ci pour la sélectionner, puis de taper la nouvelle valeur et de valider par "return" ou "enter" (ou encore en cliquant ailleurs). 41 15 Sélection d’une partie du son Pour désélectionner tout ou partie du son, il suffit : 42 • soit de faire une nouvelle sélection, • soit de positionner l’outil curseur n’importe où sur la zone du sonagramme et de cliquer. 16 Les analyses Les analyses ne peuvent se faire que sur un son ouvert. 16.1 Les paramètres généraux d’analyse Ces paramètres sont à régler dans la partie du panneau ("Analysis Settings", "FFT Settings") ouvert par certaines analyses. Ils concernent le sonagramme ("Sonogram Analysis"), l’analyse de la fréquence fondamentale (F0) ("Fundamental Analysis"), l’analyse du suivi de partiels ("Partial Tracking Analysis"), l’analyse en séquence d’accords ("Chord Sequence Analysis"), les marqueurs obtenus par analyse ("Generate Markers. . . "). • "Window Size" (Taille de la fenêtre) : la taille de la fenêtre détermine le nombre d’échantillons du son dans chaque analyse. La taille de la fenêtre est le paramètre essentiel de l’analyse : il détermine les résolutions fréquentielle et temporelle. Les champs "Window Size" et "Fundamental Frequency" sont interdépendants. • "Fundamental Frequency" (Fréquence fondamentale) en Hz : permet d’ajuster la résolution fréquentielle directement. Taille de la fenêtre, pas d’avancement et taille de la FFT sont adaptés en conséquence. La taille de la fenêtre est programmée à 5 fois la longueur de la période qui correspond à la fréquence fondamentale (résolution fréquentielle) indiquées. • "Window Step" (Pas d’avancement) : détermine l’intervalle de temps entre 2 analyses successives. Celui-ci est mesuré en nombre d’échantillons. En manuel, vous précisez vous-même le pas d’avancement (pour les utilisateurs avertis : flag -I). Le mode automatique adapte le pas d’avancement en fonction de l’opération demandée pour un résultat optimal. Dans le cas de l’analyse, le pas d’avancement est égal au 1/8 de la taille de la fenêtre • "FFT Size" (Taille de la FFT) : détermine le nombre de points de l’analyse ; il est obligatoirement égal ou supérieur à la taille de la fenêtre. • "Analysis Window" (Fenêtre d’analyse) : permet de spécifier le type de fenêtre utilisé dans l’analyse. Trois types de fenêtres sont proposés : Blackman, Hanning et Hamming. Note : Par défaut, la case "Verbose Output" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). 16.2 "Sonogram Analysis" : le sonagramme Pour les sons autres que monophoniques, cette analyse se fait sur l’un des canaux au choix ou sur tous les canaux à la fois. Trois types d’analyse sont disponibles : 43 16 Les analyses • l’analyse par Transformée de Fourier : FFT • l’analyse par Prédiction Linéaire : LPC • l’analyse Cepstre discret ("Discret Cepstrum") Dans le menu "Analysis", choisissez "Sonogram Analysis. . . " : Si une partie du son est sélectionnée, vous pouvez choisir "Sonogram of Selection. . . " : seule cette partie du son sera analysée et le sonagramme correspondant affiché. Une boîte de dialogue s’ouvre pour vous permettre de choisir vos paramètres : Outre les paramètres décrits ci-dessus, il faut déterminer : • "Analysis Type" (Type d’analyse) : permet de choisir entre FFT, LPC et Discrete Cepstrum. • "LPC Order" (ordre de la LPC) : définit le nombre de pôles pour LPC ou le nombre de coefficients de cepstre pour Discrete Cepstrum. • "Channel to analyse" : permet de choisir soit un canal, soit tous les canaux (pour les sons autres que monophoniques). Il suffit, alors, de cliquer sur "Do Analysis". En bas de la fenêtre d’AudioSculpt, dans la partie console (zone 5), s’affichent des informations et une barre de progression qui renseigne sur l’avancement du calcul. 44 16 Les analyses Celui-ci terminé, le sonagramme s’affiche. Le bouton "Stop" situé à droite de la barre de progression permet d’interrompre le calcul : le sonagramme partiel s’affichera. Par défaut, celui-ci montre la bande comprise entre 0 et 7000 Hz, là où se trouvent les éléments les plus intéressants. Un double-clic sur l’échelle verticale affiche la totalité du sonagramme (entre 0 et 22050 Hz, dans le cas d’un son échantillonné à 44100 Hz). Vous pouvez modifier l’affichage du sonagramme en agissant dans la palette flottante "Sonogram Display". Note : Celle-ci s’ouvre si vous avez coché l’item "Show Sonogram Display" du menu "Window" (voir sections 13 et 31.6). La touche "tabulation" permet de masquer ou de montrer tour à tour cette palette ainsi que celles des trois autres ("Palette d’outils ("Tools")", "Inspector", "Grid Settings") qui sont cochées. Le raccourci clavier "Pomme+J" ("commande+J") affiche ou cache la palette "Sonogram Display" à volonté. 45 16 Les analyses Il est possible de désactiver l’affichage du sonagramme en décochant la case "Sonogram", cochée par défaut dans cette palette. Deux potentiomètres linéaires horizontaux permettent de régler son affichage en niveau de gris. Les réglages par défaut sont : • "Black Threshold" : -10 dB, seuil pour le noir, • "White Threshold" : -60 dB, seuil pour le blanc. Dans le menu "Window", l’item "Optimize Sonogram" permet d’afficher plein écran le sonagramme et la "fenêtre dans le son" (zones 2 et 3), et de revenir à la taille initiale. Le raccourci clavier correspondant est "Pomme+U" ("commande+U"). Il est possible de faire des sonagrammes de sons de n’importe quelle durée. Outre le calcul, dont on suit l’avancement grâce à la barre de progression, l’affichage peut prendre un certain temps : dans ce cas, le pourcentage de la lecture de l’affichage apparaît sur le sonagramme. Il en est de même pour les sons multicanaux (plusieurs sonagrammes à afficher). 46 16 Les analyses Après un zoom dans le sonagramme d’un son long, il est possible de s’y promener. Mais au bout d’un moment, AudioSculpt doit recharger une image détaillée et la même indication de pourcentage apparaît. "Export Image" du menu "File" permet d’exporter l’image du sonagramme et/ou de la forme d’onde au format PNG,TIFF ou JPEG. Important : l’image obtenue peut être très grande. La sauvegarde du fichier SDIF contenant l’image du sonagramme se fait avec "Save Analysis As. . . " du menu "File" en choisissant "Save Sonogram As. . . " dans le sous-menu présenté. 47 16 Les analyses Une fenêtre de dialogue standard vous demande sous quel nom (par défaut "nom_du_son.fft.sdif") et à quel endroit vous désirez sauvegarder le fichier. Il vous est proposé logiquement de le sauvegarder dans le dossier "Fft", situé dans le dossier de l’application, mais l’enregistrement est possible à tout autre endroit. Vous pouvez donc sauvegarder plusieurs sonagrammes du même son, effectués avec des paramètres différents. Note : Quel que soit le type de sonagramme effectuée (FFT, LPC ou Cepstre discret), le nom proposé par défaut est seulement "nom_du_son.fft.sdif". Il sera judicieux de le modifier en fonction de l’analyse faite. L’item "Open Sonogram. . . " du sous-menu "Open Analysis. . . " du menu "File" ouvre une boîte de dialogue standard permettant de choisir parmi les fichiers précédemment sauvegardés. 48 16 Les analyses Note : Si un son est ouvert et que vous demandez l’ouverture d’un fichier d’analyse effectué sur un autre son, AudioSculpt vous demande si vous êtes bien sûr de vouloir l’ouvrir pour ce son. Par défaut, il propose de chercher et d’ouvrir le son correspondant à l’analyse. Note : Si aucun son n’est ouvert et que vous demandez l’ouverture d’un fichier d’analyse, AudioSculpt ouvrira le son correspondant à cette analyse. 16.3 "Fundamental Analysis" : Analyse de la fréquence fondamentale (F0) Cette analyse cherche la fréquence fondamentale à l’aide d’une analyse des pics spectraux. Une estimation de la fréquence fondamentale est faite dans chaque fenêtre d’analyse. Cette analyse se fait sur tout ou partie du son. Pour les sons autres que monophoniques, cette analyse se fait sur l’un des canaux au choix ou sur tous les canaux à la fois. Elle génère un fichier SDIF contenant l’estimation de la fréquence fondamentale du son. Cette estimation de F0 est affichée sous forme de Bpf dans la fenêtre du sonagramme. Si le sonagramme est affiché, elle s’y superpose. Cette Bpf peut être éditée et modifiée dans l’éditeur de Bpf (voir section 19.4.1). Dans le menu "Analysis", l’item "Fundamental Analysis. . . " ouvre le panneau de réglage "Fundamental Analysis Parameters" dans lequel vous réglez les paramètres d’analyse habituels (voir section 16.1) ainsi que : 49 16 Les analyses • "Fundamental Minimal Frequency" en Hz : seuil minimal de fréquence fondamentale en dessous duquel la fréquence ne sera pas recherchée (par défaut : 50 Hz). • "Fundamental Maximal Frequency" en Hz : seuil maximal de fréquence fondamentale au-dessus duquel la fréquence ne sera pas recherchée (par défaut : 1000 Hz). • "Maximal Frequency in Spectrum" en Hz : l’analyse ne prendra pas en compte les pics spectraux situés au-dessus de ce seuil (par défaut 4000 Hz). • "Noise Threshold" en dB : spécifie un niveau de bruit : si la différence en amplitude entre un pic et le pic le plus haut est plus grande que cette valeur, ce pic est négligé. • "Smooth Order" : ordre du filtre des valeurs pour le lissage des fréquences (par défaut 3). • En outre, il est possible de restreindre à la sélection ou d’en définir une autre. Il suffit de cocher la case "Restrict to Selection" et, éventuellement de rentrer de nouvelles valeurs dans les champs adéquats. • "Channel to analyse" : permet de choisir soit un canal, soit tous les canaux (pour les sons autres que monophoniques). Le bouton "Do Analysis" lance le calcul, dont vous suivez l’avancement grâce à la barre de progression située en haut de la zone 5 (console intégrée). A la fin du calcul, la Bpf s’affiche sur le sonagramme. Note : Le calcul peut être interrompu à tout moment en pressant sur le bouton "Stop" situé à droite de la barre de progression. Dans ce cas, le résultat partiel sera affiché. On peut masquer l’affichage à volonté dans la palette "Sonogram Display" (voir section 13). 50 16 Les analyses Pour effacer la Bpf, il faut cliquer sur la courbe et appuyer sur la touche "Delete" (touche "<-" ou "Backspace"). Pour l’éditer, il faut double-cliquer sur la courbe. L’éditeur de Bpf s’ouvre et permet des modifications grâce au crayon, à la gomme, aux "Bpf Tools". . . (se reporter à la documentation de Diphone Studio). Lorsqu’on referme la Bpf modifiée, une boîte de dialogue vous propose d’enregistrer les modifications du fichier SDIF, mais il remplacera le précédent (même nom). Les modifications apparaissent sur le sonagramme. Il est possible de sauvegarder plusieurs fichiers F0 en cours de travail (item "Save Analysis As. . . " du menu "File", sous menu "Save Fundamental As. . . "). Mais, attention, "Save Fundamental As. . . " n’enregistre que le dernier (il en est de même avec le panneau d’enregistrement présenté à la fermeture du son ; voir la section 29). Il est possible de changer les paramètres d’analyse sur une partie du son, le reste sera conservé avec les anciens paramètres. Note : Vous ne pouvez pas sauvegarder les Bpf de type F0 comme les autres Bpf. Si vous souhaitez la récupérer pour la réutiliser en tant que Bpf, il faut la copier et la coller dans une nouvelle Bpf ouverte par "New Bpf. . . " du menu "File". Vous pouvez sauvegarder le fichier SDIF correspondant de la manière habituelle (voir 51 16 Les analyses section 29). Ce fichier sera sauvegardé avec "Save Fundamental As. . . ", sous-menu de "Save Analysis. . . " du menu "File» (par défaut sous le nom de "mon_son.f0.sdif") et exploité ailleurs. Il vous est proposé logiquement de le sauvegarder dans le dossier "Fundamental", situé dans le dossier de l’application, mais l’enregistrement est possible à tout autre endroit. L’item "Open Fundamental. . . " du sous-menu "Open Analysis. . . " du menu "File" ouvre une boîte de dialogue standard permettant de choisir parmi les fichiers précédemment sauvegardés. Note : Si un son est ouvert et que vous demandez l’ouverture d’un fichier d’analyse effectué sur un autre son, AudioSculpt vous demande si vous êtes bien sûr de vouloir l’ouvrir pour ce son. Par défaut, il propose de chercher et d’ouvrir le son correspondant à l’analyse. Note : Si aucun son n’est ouvert et que vous demandez l’ouverture d’un fichier d’analyse, AudioSculpt ouvrira le son correspondant à cette analyse. 16.4 "Partial Tracking Analysis" : Analyse en suivi de partiels Une estimation et un suivi des partiels sont faits dans chaque fenêtre d’analyse. Cette analyse se fait sur tout ou partie du son. Il est possible de restreindre à la sélection ou d’en définir une autre. Il suffit de cocher la case "Restrict to Selection" et, éventuellement de rentrer de nouvelles valeurs dans les champs adéquats. Elle génère un fichier SDIF contenant l’estimation du suivi des partiels du fichier son. Cette estimation est affichée sous forme de multi-Bpf dans la fenêtre du sonagramme. Si le sonagramme est affiché, elle s’y superpose. Cette multi-Bpf peut être éditée et modifiée dans l’éditeur de Bpf (voir section 19.4.1). Important : Pour les sons stéréophoniques et multicanaux, l’analyse de suivi de partiels ne peut se faire que sur un seul canal à la fois. • "Channel to analyse" : permet de choisir le canal à analyser (pour les sons autres que monophoniques). Si vous interrompez le calcul, l’analyse est annulée et SuperVP (en fait pm2) vous retourne une erreur. 16.4.1 L’analyse inharmonique Dans le menu "Analysis", l’item "Partial Tracking Analysis. . . " ouvre le panneau de réglage "Partial Tracking Parameters" dans lequel vous réglez les paramètres d’analyse habituels "FFT Settings" (voir section 16.1) ainsi que les paramètres généraux d’analyse inharmonique (présentée par défaut) : • 52 "Maximum Number of Partials" : nombre maximal de partiels. 16 Les analyses • "Minimum Amplitude Level" en dB : amplitude minimale d’un partiel. • "Smoothing Envelope Attack" en seconde : durée de la rampe d’attaque (à l’heure actuelle, cette valeur doit être à zéro pour l’analyse). • "Smoothing Envelope Release" en seconde : durée de la rampe de relâchement (à l’heure actuelle, cette valeur doit être à zéro pour l’analyse). "Peak Connection" : réglage de la connexion entre les pics contenus dans deux fenêtres d’analyse successives. Les pics à connecter sont choisis en fonction de la variation fréquentielle et de la variation d’amplitude permises entre eux. La variation fréquentielle permise est constituée d’une partie exprimée en fréquence relative et d’une partie en fréquence absolue. • "Relative Frequency Deviation" en centième de demi-ton ("cents") : variance de la distance fréquentielle relative. Par défaut, la valeur est 20 centième de demi-ton ("cents"). • "Constant Frequency Deviation" en Hz : variance de la distance fréquentielle absolue. Par défaut, elle est nulle. • "Relative Amplitude Deviation" en pourcentage : variance de la distance relative entre les amplitudes. La valeur par défaut est de 50 %. • "Source Partial Neighbors" (entre 1 et 10) : nombre de pics voisins considérés comme candidats sources possibles pour l’optimisation locale des connexions. La valeur par défaut est 1. • "Target Partial Neighbors" (entre 1 et 10) : nombre de pics voisins considérés comme candidats cibles possibles. La valeur pour la source doit être inférieure ou égale à la valeur pour la cible. La valeur par défaut est 3. "Partial Connection" : réglage de la connexion entre fragments de partiels. • "Time Gap to Connect Over" en seconde : distance temporelle maximale entre deux fragments à connecter. Par défaut, la valeur est de 0.017 seconde. • "Frequency Gap to Connect Over" en centième de demi-ton ("cents") : distance fréquentielle relative maximale entre deux fragments à connecter. Par défaut, la valeur est 20 centième de demi-ton ("cents"). • "Minimum Partial Length" en seconde : durée minimum d’un partiel ; les fragments plus courts sont écartés. Par défaut, la valeur est de 0.009 seconde. 53 16 Les analyses 16.4.2 L’analyse harmonique L’analyse inharmonique est proposée par défaut. Il faut cocher "Harmonic Analysis" pour obtenir une analyse harmonique (les paramètres sont alors disponibles). Il faut avoir déjà fait une analyse de la fréquence fondamentale (f0), l’avoir sauvegardée (sous un nom compréhensible, cela peut vous aider, par exemple "mon_son.f0.sdif") et la sélectionner grâce au bouton "Select". • Le bouton "Select" ouvre une boîte de dialogue standard vous permettant de choisir un fichier de type "mon_son.f0.sdif". • "Bandwidth Partial Seeve" : coefficient multiplicateur de f0 qui définit la largeur des bandes dans lesquelles seront recherchées les harmoniques. Cette valeur est comprise entre 0 et 1 ; pour la valeur 1, la largeur de chaque bande sera égale à f0. Important : les paramètres définis dans "Peak Connection" et "Partial Connection" ne sont pas actifs. 54 16 Les analyses Le bouton "Do Analysis" lance le calcul, dont vous suivez l’avancement grâce à la barre de progression située en haut de la zone 5 (console intégrée). Cette analyse génère un fichier SDIF contenant l’estimation du suivi de partiels du fichier son. Ces partiels sont affichés (en couleur) dans la fenêtre du sonagramme. On peut en masquer l’affichage à volonté dans la palette "Sonogram Display" (voir section 13). Le fichier obtenu peut être sauvegardé avec "Save Partial Tracking As. . . " du menu "File" (par défaut sous le nom de "mon_son.hrm.sdif" pour l’analyse harmonique ou "mon_son.trc.sdif" pour l’analyse inharmonique) et exploité ailleurs. 55 16 Les analyses Pour effacer les résultats de l’analyse, il faut cliquer sur l’une des courbes et faire "Delete" (touche "<-" ou "Backspace"). Pour les éditer, il faut double-cliquer sur l’une des courbes. L’éditeur de Bpf s’ouvre et permet des modifications grâce au crayon, à la gomme, aux "Bpf Tools" (se reporter à la documentation de Diphone Studio). Lorsqu’on referme la Bpf modifiée, une boîte de dialogue vous propose d’enregistrer les modifications du fichier SDIF, mais il remplacera le précédent (même nom). Il faut utiliser l’item non grisé "Save Analysis As. . . " du menu "File" pour changer le nom. Les modifications apparaissent sur le sonagramme. Il est possible de sauvegarder plusieurs fichiers (ayant des paramètres différents) en cours de travail. Mais, attention, "Save Partial Tracking As. . . " n’enregistre que le dernier (il en est de même avec le panneau d’enregistrement présenté à la fermeture du son ; voir la section : "Sauvegarde des fichiers"). L’item "Open Partial Tracking. . . " du sous-menu "Open Analysis. . . " du menu "File" ouvre une boîte de dialogue standard permettant de choisir parmi les fichiers précédemment sauvegardés. Note : Si un son est ouvert et que vous demandez l’ouverture d’un fichier d’analyse effectué sur un autre son, AudioSculpt vous demande si vous êtes bien sûr de vouloir l’ouvrir pour ce son. Par défaut, il propose de chercher et d’ouvrir le son correspondant à l’analyse. Note : Si aucun son n’est ouvert et que vous demandez l’ouverture d’un fichier d’analyse, AudioSculpt ouvrira le son correspondant à cette analyse. 56 16 Les analyses 16.5 "Chord Sequence Analysis" : Analyse en séquence d’accords Sur une région, un "accord" est un groupe de partiels à fréquences et amplitudes fixes représentés par des segments de droite horizontaux dont le début et la fin sont définis par les marqueurs délimitant la région. Cette analyse génère un fichier SDIF contenant l’estimation du suivi des partiels du fichier son. Cette estimation est affichée sous forme de multi-Bpf dans la fenêtre du sonagramme. Si le sonagramme est affiché, elle s’y superpose. L’analyse en séquence d’accords ("Chord Sequence Analysis. . . ") se fait donc sur une ou plusieurs régions préalablement définies par des marqueurs. Pour ce faire, l’item "Add Chord Seq Markers" (raccourci clavier "Q") du menu "Edit" pose une paire de marqueurs, un marqueur de début et un marqueur de fin aux extrémités d’une sélection. Il est ainsi possible de définir plusieurs régions, celles-ci pouvant être disjointes. Il est aussi possible d’utiliser n’importe quel type de marqueurs (manuel ou obtenu par analyse ; voir section 17). Il en faut au moins deux. Le premier sera le marqueur de début et le dernier, le marqueur de fin. Les marqueurs intermédiaires seront considérés à la fois, comme marqueur de fin pour la région précédente et comme marqueur de début pour la région suivante. 57 16 Les analyses L’item "Chord Sequence Analysis. . . " du menu "Analysis" ouvre le panneau de réglage des paramètres. Note : "Restrict to selection" permet de restreindre le calcul de l’analyse à une portion du son, mais encore faut-il que celle-ci contienne au moins une paire de marqueurs. Si vous avez sélectionné une partie du son, la case est cochée par défaut. N’oubliez pas d’avoir posé des marqueurs dans ou aux extrémités de cette sélection. Deux méthodes d’analyse sont proposées : • Averaged Spectrum • Inharmonic Partial Avereging 16.5.1 "Average Spectrum" Cette analyse fait la moyenne du spectrogramme sur le segment considéré (entre deux marqueurs successifs) et fait coïncider un partiel pour chaque pic selon les paramètres décrits ci-dessous. Les paramètres d’analyse ("FFT Settings") sont les paramètres d’analyse habituels. 58 • "Maximum Number of Partials" : détermine le nombre maximum de partiels recherchés. • "Maximum Amplitude Level (Att.)" : valeur maximale de l’atténuation d’amplitude par rapport à 0 dB. Cela correspond, en fait, à la valeur de l’amplitude minimale des pics pouvant être considérés comme partiels. 16 Les analyses 16.5.2 "Inharmonic Partial Averging" Cette analyse fait la moyenne des partiels obtenus avec l’analyse du suivi de partiels en mode inharmonique. Un partiel sera considéré comme élément d’accord uniquement s’il existe sur la totalité du segment compris entre deux marqueurs successifs Pour un résultat satisfaisant, il est nécessaire d’adapter les paramètres utilisé dans l’analyse inharmonique "Partial Tracking" de façon à ce que certains partiels obtenus couvrent le segment complet. Il est donc nécessaire de faire cette analyse ("Partial Tracking Analysis" en mode inharmonique) pour avoir une représentation visuelle du comportement des partiels et, si le résultat semble satisfaisant, il suffit d’appliquer les mêmes paramètres pour l’analyse en séquence d’accords ("Chord Sequence Analysis"). Note : Pour l’analyse en séquence d’accords ("Chord Sequence Analysis"), les paramètres "Smoothing Envelope Attack" et "Smoothing Envelope Release" sont à zéro, il est donc important qu’ils le soient aussi pour l’analyse préparatoire ("Partial Tracking Analysis" en mode inharmonique). Note : Pour le moment, il est impossible d’exporter ces paramètres, il faut donc les noter et les entrer à la main. 59 16 Les analyses Important : Pour les sons stéréophoniques et multicanaux, l’analyse en séquence d’accords ne peut se faire que sur un seul canal à la fois. Il est possible de sauvegarder plusieurs fichiers (ayant des paramètres différents) en cours de travail. Mais, attention, "Save Chord Sequences As. . . " n’enregistre que le dernier (il en est de même avec le panneau d’enregistrement présenté à la fermeture du son ; voir la section : "Sauvegarde des fichiers"). L’item "Open Chord Sequences. . . " du sous-menu "Open Analysis. . . " du menu "File" ouvre une boîte de dialogue standard permettant de choisir parmi les fichiers précédemment sauvegardés. Note : Si un son est ouvert et que vous demandez l’ouverture d’un fichier d’analyse effectué sur un autre son, AudioSculpt vous demande si vous êtes bien sûr de vouloir l’ouvrir pour ce son. Par défaut, il propose de chercher et d’ouvrir le son correspondant à l’analyse. Note : Si aucun son n’est ouvert et que vous demandez l’ouverture d’un fichier d’analyse, AudioSculpt ouvrira le son correspondant à cette analyse. 16.6 Les marqueurs obtenus par analyse Trois types de marqueurs peuvent être générés par analyse : • Les marqueurs par détection des transitoires ("Transient detection") utilisent l’algorithme de détection de transitoire de SuperVP. • Les marqueurs dits "Spectral Flow Markers" (détection d’une variation rapide de l’énergie du signal). Dans ce cas, deux options sont disponibles : • "Spectral différencing (positive)" qui détecte une augmentation rapide de l’énergie du signal (ce qui peut être apparenté à un début de note) • "Spectral différencing (negative)" qui détecte une diminution rapide de l’énergie du signal (ce qui peut être apparenté à une fin de note) Reportez-vous à la section 17. L’item "Open Markers. . . " du sous-menu "Open Analysis. . . " du menu "File" ouvre une boîte de dialogue standard permettant de choisir parmi les fichiers précédemment sauvegardés. 60 16 Les analyses Note : Si un son est ouvert et que vous demandez l’ouverture d’un fichier d’analyse effectué sur un autre son, AudioSculpt vous demande si vous êtes bien sûr de vouloir l’ouvrir pour ce son. Par défaut, il propose de chercher et d’ouvrir le son correspondant à l’analyse. Note : Si aucun son n’est ouvert et que vous demandez l’ouverture d’un fichier d’analyse, AudioSculpt ouvrira le son correspondant à cette analyse. 16.7 "Peak Detection" : détection des pics Cette analyse cherche les maxima dans chaque spectre d’amplitude à court terme consécutif. Cette analyse se fait sur la totalité du son. Les résultats ne s’affichent pas sur le sonagramme et sont enregistrés directement dans un fichier au format texte (voir sections 29 et 30.1). Dans le menu "Analysis", l’item "Peak Analysis" ouvre le panneau de réglage "Peak Detection" dans lequel vous réglez les paramètres d’analyse habituels ainsi que : • "Threshold" in dB (seuil en dB) : la différence d’amplitude entre le sommet du pic et les minima voisins doit dépasser ce seuil. Les pics qui ne satisfont pas à cette contrainte sont négligés. La valeur par défaut est 25 dB. Si le seuil est zéro, tous les pics seront trouvés. • "Number of Peaks" (nombre de pics) : permet de spécifier le nombre "n" de pics qui doivent être pris en considération dans chaque fenêtre d’analyse. Seuls les "n" pics avec les amplitudes les plus élevées sont donnés dans les résultats. Par défaut, "n" égale 3. Note : Par défaut, la case "Verbose" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). 61 16 Les analyses Vous validez par "OK". La fenêtre se referme et une fenêtre de dialogue standard s’ouvre, demandant sous quel nom et à quel endroit vous désirez enregistrer le résultat. Le choix fait, vous validez par "OK". Cette fenêtre se referme et le calcul se lance. Les résultats sont enregistrés dans un fichier au format texte : • la première ligne indique le moment où est fait l’analyse : t en secondes, • les lignes suivantes (selon le nombre de pics trouvés) : la fréquence (en Hz) et l’amplitude (en dB) des pics rangés par ordre croissant de fréquence. Les données sont rangées en colonnes séparées par des tabulations. 16.8 "Masking Effects" L’algorithme de Terhardt réduit le spectre d’amplitude au petit nombre de pics qui contribuent à la perception tonale du son. En fait, cela modélise le filtrage par effet de masque de l’oreille interne. Cette analyse se fait sur la totalité du son. Les résultats ne s’affichent pas sur le sonagramme et sont enregistrés directement dans un fichier au format texte (voir sections 29 et 30.1). Dans le menu "Analysis", l’item "Masking Effects" ouvre le panneau de réglage "Masking Effects" dans lequel vous réglez les paramètres d’analyse habituels ainsi que : • "Threshold" (seuil en dB) : La différence d’amplitude entre le pic situé à l’index i et l’amplitude de ses voisins aux index i-3, i-2, i+2, i+3 ne doit pas excéder ce seuil. Les pics qui ne satisfont pas à cette contrainte sont négligés. La valeur par défaut -60 dB. • "Maximum Number of Peaks" : permet de spécifier le nombre "n" de pics qui doivent être pris en considération. Seuls les "n" pics ayant les amplitudes les plus élevées sont donnés dans les résultats . Par défaut, "n" égale 3. Note : Par défaut, la case "Verbose" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). 62 16 Les analyses Les résultats stockés dans le fichier de sortie sont : • "Time and/or Number" : temps et/ou nombre de pics trouvés. • "Frequency" (optionnel) : fréquence du pic. • "True Pitch" : donne une estimation du "True Spectral Pitch" : la hauteur des composantes spectrales est la même que celle perçue par l’auditeur. • "Amplitude" (optionnel) : amplitude du pic. • "Weight" (optionnel) : le poids mesure l’importance spectrale des composantes. Il est toujours supérieur à zéro. • "Excess Sound Pressure Level" : cette valeur est donnée pour chaque pic et indique son niveau de perception par rapport au seuil de masque. Plus la valeur est élevée, plus la sinusoïde attachée à ce pic est perceptible. Si la valeur est nulle, il n’est pas perceptible. Fréquence, amplitude et poids sont optionnels. L’ordre et le choix de stockage concernant le temps et le nombre de pics est destiné à faciliter l’utilisation de tels fichiers dans "OpenMusic". Dans le fichier texte, la première ligne indique le moment où se fait l’analyse et/ou le nombre de pics (selon le choix) et les lignes suivantes les données demandées en colonnes séparées par des tabulations. 63 16 Les analyses 64 17 Les marqueurs : "Markers" Plusieurs types de marqueur sont à votre disposition : 17.1 Les marqueurs manuels ("Hand Markers") L’outil marqueur (voir la section 11.13) permet de poser un marqueur à l’endroit voulu sur le sonagramme ou aussi sur la zone 2 (fenêtre dans le son) ou sur les pistes du séquenceur. Vous pouvez utiliser aussi l’item "Add Marker" (ou son raccourci clavier "T") du menu "Edit" qui place un marqueur en début de la sélection. Lors de la lecture, le raccourci clavier "T" permet de les poser au vol. Une case à cocher permettant de cacher ou montrer les marqueurs apparaît dans la fenêtre "Sonogram Display". Note : Si vous avez masqué les marqueurs, ils ne seront pas enregistrés dans le fichier SDIF correspondant (le fichier sera vide). Le fichier contenant les marqueurs peut être sauvegardé, par défaut sous le nom de "monson.mrk.sdif" (au format SDIF), avec "Save Fundamental As. . . ", sous-menu de "Save Analysis. . . " du menu "File", (voir section 29). Ces fichiers sont éditables et exploitables dans d’autres logiciels. 17.2 Les marqueurs automatiques Il existe trois types de marqueurs générés automatiquement par analyse : • Les marqueurs par détection des transitoires ("Transient detection") utilisent le nouvel algorithme de détection de transitoire de SuperVP (qui est utilisé aussi pour les dilatations). • Les marqueurs dits "Spectral Flow Markers" (détection d’une variation rapide de l’énergie du signal : c’est l’algorithme déjà utilisé dans la version 1.2 d’AudioSculpt. Pour ceux-ci, deux options sont disponibles : • "Spectral différencing (positive)" qui détecte une augmentation rapide de l’énergie du signal (ce qui peut être apparenté à un début de note) • "Spectral différencing (negative)" qui détecte une diminution rapide de l’énergie du signal (ce qui peut être apparenté à une fin de note) Le choix et la détermination des paramètres se font dans le panneau "Marker Parameters" ouvert par l’item "Generate Markers. . . " du menu "Analysis". Outre le réglage de "FFT Analysis Settings", il faut déterminer les paramètres de la détection des transitoires ("Transient Detection Settings"). Pour cela, reportez-vous à la section 27. 65 17 Les marqueurs : "Markers" Note : Par défaut, la case "Verbose Output" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). Après avoir fait l’analyse, les marqueurs s’affichent sur la partie sonagramme. Un potentiomètre linéaire apparaît dans la fenêtre "Sonogram Display" (ainsi que la case à cocher permettant de cacher ou montrer les marqueurs calculés) qui permet de régler le seuil d’affichage de ceux-ci en fonction de leur valeur. Note : Le potentiomètre apparaît pour chacun des trois types de marqueurs. 66 17 Les marqueurs : "Markers" Note : Si vous avez masqué les marqueurs, ils ne seront pas enregistrés dans le fichier SDIF correspondant (le fichier sera vide). Si vous avez agi avec le potentiomètre, les marqueurs cachés ne seront pas enregistrés dans le fichier SDIF (voir la section 29). Ces marqueurs peuvent être déplacés à la main ou modifiés via la fenêtre "Inspector". La sélection se fait en cliquant sur l’un des triangles supérieurs. Une sélection multiple se fait de la manière habituelle en appuyant sur la touche "majuscule temporaire" (shift). Dans ce cas, seul le déplacement manuel agira sur chacun d’eux. Note : la fenêtre "Inspector" n’agit que sur le dernier élément sélectionné (voir la section 12). 17.3 Les marqueurs de "Chord Sequence Analysis. . . " Ils sont d’un autre type puisqu’ils vont par paire : un marqueur de début et un marqueur de fin (voir la section 16.5). Ces marqueurs se posent manuellement : il faut d’abord sélectionner une région. Puis, "Add Chord Seq Markers" (raccourci clavier "Q") du menu "Edit" définit la paire de marqueurs (marqueur de début et marqueur de fin). Ils sont de couleur rouge. 67 17 Les marqueurs : "Markers" 17.4 Couleur des marqueurs Les marqueurs manuels "Hand Added Markers" : rouge "Transient Markers" : bleu "Positive Spectral Flow Markers" : vert 68 17 Les marqueurs : "Markers" "Negative Spectral Flow Markers" : orange 17.5 Points communs à tous les marqueurs 17.5.1 Sélection des marqueurs La sélection se fait en cliquant avec n’importe quel outil (sauf, bien évidemment avec l’outil "Marker" sur l’un des triangles supérieurs). Une sélection multiple se fait de la manière habituelle en appuyant sur la touche "majuscule temporaire" (shift). 17.5.2 Déplacement (édition) des marqueurs Les marqueurs peuvent être déplacés à la main avec n’importe quel outil (sauf le diapason et l’outil marqueur) ou modifiés via la fenêtre "Inspector". Si plusieurs marqueurs sont sélectionnés, seul le déplacement manuel agira sur chacun d’eux. 69 17 Les marqueurs : "Markers" Note : La fenêtre "Inspector" n’agit que sur le dernier élément sélectionné (voir la section 12). 17.5.3 Suppression de marqueurs Pour en supprimer un (ou plusieurs en cas de sélection multiple), le menu "Edit" propose : "Delete Selected Markers. . . ". Les marqueurs sélectionnés (de n’importe quel type) seront détruits. L’item "Delete Markers" du menu "Edit" permet de choisir le (ou les) type(s) de marqueurs à détruire dans son ensemble. Il appelle le panneau "Delete Markers" où s’opère le choix. 17.5.4 Sauvegarde des marqueurs Tous les marqueurs, quel qu’en soit le type, sont enregistrés dans le même fichier SDIF, tels qu’ils sont visibles à l’écran. Mais vous pouvez, à tout moment, faire d’autres sauvegardes sous d’autres noms. Ce fichier SDIF (par défaut : "monson.mrk.sdif") est éditable et exploitable dans d’autres logiciels. Cette sauvegarde se fait de la manière habituelle, avec l’item "Save Markers As. . . ", sousmenu de "Save Analysis. . . " du menu "File» (voir la section 29). 70 17 Les marqueurs : "Markers" Si vous fermer un son ou si vous quittez AudioSculpt sans avoir fait de sauvegarde, celui-ci vous en avertira et vous pourrez décider, à ce moment-là, de le faire ou non. Vous pouvez donner un nom à chacun d’entre eux en utilisant le champ "Label" dans la palette "Inspector". Note : Pour les marqueurs manuels ainsi que pour les marqueurs "Chord Seq", le champ "value" est aussi disponible pour une dénomination. 17.5.5 Ouverture de fichiers de marqueurs sauvegardés Lorsqu’un son est ouvert, vous pouvez ouvrir l’un des fichiers SDIF précédemment sauvegardé, contenant les marqueurs correspondants. L’item "Open Analysis. . . " propose un sous-menu dans lequel vous choisissez "Open Markers. . . ". La fenêtre de dialogue standard s’ouvre, montrant par défaut le contenu du dossier "Markers", mais permettant aussi de naviguer dans l’arborescence des disques durs et d’y choisir un fichier ".mrk.sdif". Note : Si le fichier choisi ne correspond pas au son, AudioSculpt vous demande si vous êtes bien sûr de vouloir l’ouvrir pour ce son. Par défaut, il propose de chercher et d’ouvrir le son correspondant. 71 17 Les marqueurs : "Markers" Note : Si aucun son n’est ouvert et que vous demandez l’ouverture d’un fichier contenant des marqueurs, AudioSculpt ouvrira le son correspondant. 72 18 Spectre et diapason Lorsque vous jouez tout ou partie d’un son dont le sonagramme est ouvert, l’affichage du spectre (en rouge) suit l’avancement du curseur. Si vous positionnez l’outil diapason dans le sonagramme, le spectre, correspondant à cet instant du son s’affiche en bleu. La partie sensible du diapason est la petite boule située à sa base. Fréquence, amplitude et position temporelle sont indiquées dans la partie droite de la palette d’outils (voir section 11.1). Vous pouvez ainsi comparer les spectres pris à deux moments différents (en rouge, à la position du curseur et en bleu, à la position du diapason). Il est facile de choisir la position du curseur : soit en le déplaçant manuellement, soit en 73 18 Spectre et diapason tapant sa valeur dans le premier champ éditable en haut de la fenêtre (voir section 5.2). Un son sinusoïdal pur est joué avec la fréquence et l’amplitude correspondant au point cliqué sur le sonagramme. Fréquence et amplitude (ainsi que position temporelle) sont indiquées dans "l’Inspector" (voir section 12). La touche "shift" (majuscule temporaire) enfoncée permet de contraindre un déplacement horizontal ou vertical du diapason. Il est, bien sûr, possible d’agrandir la zone réservée au spectrogramme (voir section 5.2). Les zooms par les règles ou par la loupe sont utilisables aussi (voir sections 10.1 et 10.2). 74 19 Définition et paramètres des traitements 19.1 Généralités Par défaut, si aucune partie du son n’est sélectionnée, un traitement s’applique à la totalité du son (sinon, il s’applique à la partie sélectionnée). Les traitements proposés sont de deux types : 19.1.1 Les traitements dits "à paramètres constants" Les paramètres de ces traitements ne sont définis que par des valeurs constantes. • Surfaces : filtrages par surfaces rectangulaires ou libres, par traits de crayon. Les surfaces ne sont accessibles que par la palette d’outils "Tools" (voir section 11). Les traitements suivants ne sont accessibles que via le menu "Treatments" (première partie du menu, voir section 31.4) : 75 19 Définition et paramètres des traitements • Constant Transposition : "Transposition" constante avec ou sans correction de temps. • Constant TimeStretch : "Dilatation/compression" à coefficient constant. • Freeze : "Gel" du son. • Reverse/Repeat : déplacement dans le son. • Constant Formant Filter : filtrage par "Formant". • Band Filter : filtrage de type "Bande" (bandes passantes ou réjection de bandes). • Clipping Filter : filtrage par "Clipping". • Image Filter : utilise une image comme filtre. 19.1.2 Les traitements dits "par Bpf" Ces traitements exigent la définition de Bpf pour certains paramètres. Une Bpf (Breakpoint Function) est une courbe définie de manière discrète par une ensemble de points reliés par des segments de droite. Ils ne sont accessibles que via le menu "Treatments" (seconde partie du menu, voir section 31.4) : • Dynamic Transposition : "Transposition" variable dans le temps. • Dynamic TimeStretch : "Dilatation/compression" à coefficient variable. • Breakpoint for Gain : modification du gain par Bpf. • Breakpoint Filter : filtre par Bpf. • Dynamic Formant : filtrage variable par "Formant". Ce type de filtrage n’est pas encore opérationnel. Note : Il n’est pas indispensable d’avoir affiché le sonagramme pour effectuer un traitement. 19.1.3 Affichage des traitements Tout traitement génère un rectangle dit "élément de piste" sur une piste du séquenceur (voir section 21), le représentant en position et en durée et portant l’icône correspondant à ce traitement. Les surfaces s’affichent sur la zone du sonagramme, que celui-ci soit affiché ou non. 76 19 Définition et paramètres des traitements Les autres traitements, s’ils sont sélectionnés, affichent, sur la zone du sonagramme, un rectangle montrant leur position. Cela permet de les placer avec précision par rapport au sonagramme. Il est possible de désactiver cet affichage sur le sonagramme en décochant la case "Treatments", cochée par défaut dans la palette flottante "Sonogram Display". Cela peut être fort utile pour pouvoir mieux observer le sonagramme, sans, pour autant, supprimer les traitements. Il est tout aussi possible de désactiver l’affichage du sonagramme pour ne conserver que les traitements. 19.2 Filtrage par surface Les filtrages par surface : 77 19 Définition et paramètres des traitements • Surface rectangulaires • Surface libre • Crayon Le filtrage par surface est utilisé pour modifier le gain d’une surface définie dans le plan temps/fréquence. Il modifie l’amplitude des composantes spectrales qui se trouvent dans la surface. Le gain définit de combien cette zone du sonagramme est amplifiée ou atténuée. Un gain positif signifie que la région sera amplifiée, un gain négatif qu’elle sera atténuée. 19.2.1 Surface rectangulaire Avec l’outil surface rectangulaire, dessinez une surface sur le sonagramme. Celle-ci est grise et en même temps apparaît sur la piste du séquenceur (zone 4) un rectangle (élément de piste) de même durée portant l’icône correspondant à ce traitement. Donnez-lui une valeur (positive ou négative en dB) en procédant comme suit : Première méthode : un double-clic sur le rectangle de la piste (élément de piste) avec n’importe quel outil (sauf le marqueur) ouvre une boîte de dialogue "Edit Gain" dans laquelle vous tapez votre valeur que vous validez par le bouton "OK". Note : Les valeurs limites sont -116 dB et +116 dB (si vous outrepassez ces limites, le nombre pris en compte sera -116 dB ou +116 dB). 78 19 Définition et paramètres des traitements Seconde méthode : positionnez l’un des outils suivants (pointeur (flèche), main, curseur de sélection ou rectangle) sur la surface placée sur le sonagramme. En appuyant sur la touche "ctrl" ("contrôle"), puis en maintenant le bouton de la souris enfoncé et en déplaçant celleci, vous faites défiler les valeurs. Les limites sont -116 dB et +116 dB. Troisième méthode : dans la fenêtre "Inspector", entrez une valeur dans le champ éditable "Gain (dB)" et validez par "enter" ou "return". Quatrième méthode : Dans le menu "Edit", choisissez l’item "Change Gain. . . " ; la boîte de dialogue "Edit Gain" s’ouvre, vous invitant à rentrer votre valeur que vous validez par le bouton "OK". Cette dernière méthode est plus particulièrement utile pour changer le gain d’un ensemble de traitements sélectionnés. La couleur de la surface dépend de la valeur du gain : plus ou moins bleue pour une valeur positive et plus ou moins rouge pour une valeur négative. 79 19 Définition et paramètres des traitements Vous pouvez déplacer comme vous le voulez la surface placée sur sonagramme avec l’outil pointeur ou l’outil main : le rectangle de la piste (élément de piste) suit. La touche "shift" enfoncée permet de contraindre un déplacement horizontal ou vertical. Vous pouvez déplacer temporellement l’élément de piste à l’aide de n’importe quel outil (sauf l’outil marqueur). En appuyant sur la touche "Option" ("alt"), l’outil pointeur (ou l’outil main) permet de dupliquer la surface et de placer la copie à l’endroit où vous le souhaitez : en dupliquant sur la piste, vous choisissez uniquement la position temporelle de la copie, en dupliquant sur le sonagramme, vous choisissez la position temporelle et la position en fréquence de la copie. Pour redimensionner votre surface, placez l’extrémité de l’outil pointeur sur un bord de celleci, il se transforme en deux petits triangles noirs, puis en cliquant, vous étirez ou réduisez la surface verticalement ou horizontalement suivant le bord utilisé. La même manipulation sur la piste avec n’importe quel outil (sauf l’outil marqueur) permet la modification en temps (voir section 11.2.3). La fenêtre "Inspector" indique la position, les dimensions et le gain du traitement par surface sélectionnée. Il est possible de modifier n’importe quels paramètres en utilisant cette fenêtre (voir section 12). 80 19 Définition et paramètres des traitements Pour supprimer une ou plusieurs surfaces, il vous suffit de les sélectionner avec n’importe quel outil (sauf l’outil marqueur) sur la piste ou avec l’outil pointeur (sur le sonagramme) de la manière habituelle (touche "majuscule temporaire" enfoncée "shift") puis d’appuyer sur la touche "delete" (touche "<-" ou "Backspace") ou de choisir "Clear" dans le menu "Edit". L’outil lasso permet de sélectionner plusieurs surfaces sur le sonagramme. Vous pouvez agir aussi sur les éléments de piste. Reportez vous aux sections 11.7 et 19.2.4.3. Le "glisser-déposer" ("Drag and Drop") d’une ou plusieurs surfaces sélectionnées (ou des éléments de piste correspondants) sur le bureau permet de sauvegarder toutes les caractéristiques de ces surfaces (positions horizontales et verticales ainsi que les gains correspondants) : le traitement prend le nom de "extrait de AudioSculpt.textClipping". Pour réutiliser ce traitement à l’identique sur n’importe quel son, il suffit de déposer cet "extrait de AudioSculpt.textClipping" sur le sonagramme (voir section 5.2). Vous pouvez renommer ces extraits comme bon vous semble. Note : Ces extraits se numérotent automatiquement par incrémentation. Pour changer le gain de plusieurs surfaces sélectionnées, utilisez l’une des méthodes décrites à la section 19.2.4.7. Les fonctions "Replicate in Frequency. . . " et "Replicate in Time. . . " du menu "Edit" ainsi que "Invert" du menu "Treatments" sont actives pour une ou plusieurs surfaces sélectionnées (voir section 19.2.4). Important : Si deux surfaces se chevauchent, il sera préférable d’utiliser le mode "Maximum" de "Filter Superposition mode" dans le panneau de réglages "Processing Parameters" appelé par "Process Treatments. . . " (voir section 25.1.2). Ce réglage est aussi disponible dans les préférences, onglet "Filter". 19.2.2 Surface libre Avec l’outil surface libre, vous pouvez dessiner deux sortes de surfaces sur le sonagramme : polygonale ou main levée (voir section 11.9). Une surface polygonale s’obtient en plaçant l’outil à l’endroit désiré pour le premier point, obtenu en cliquant une fois, puis en déplaçant l’outil à l’endroit du second point (vous tirez un segment), obtenu en cliquant une fois, et ainsi de suite. Un double-clic referme le polygone. 81 19 Définition et paramètres des traitements Il est possible de déplacer un sommet à l’aide de l’outil pointeur ou de l’outil main : celui-ci se transforme en croix de couleur rouge lorsqu’il passe sur un sommet. Il suffit de cliquer dessus et de le déplacer. Il est possible de créer un nouveau sommet à l’aide de l’outil pointeur : celui-ci se transforme en croix de couleur noire lorsqu’il passe sur un côté. Il suffit de cliquer à l’endroit désiré et de le déplacer. 82 19 Définition et paramètres des traitements Une surface main levée s’obtient en plaçant l’outil à l’endroit désiré, puis, en maintenant le bouton de la souris enfoncé, de dessiner le contour voulu. La surface se referme automatiquement (par un segment) lorsque le bouton de la souris est relâché. Les surfaces sont grises et en même temps apparaissent sur une piste (zone 4) des rectangles (éléments de piste) de même durée que chaque surface portant les icônes correspondant à chacune. Pour donner une valeur (en dB) à une surface, il suffit d’utiliser l’une des méthodes décrites pour les surfaces rectangulaires. Déplacement, duplication, suppression et sauvegarde par "glisser-déposer" ("Drag and Drop") sur le bureau de ces surfaces se font de la même manière que pour les surfaces rectangulaires. Pour redimensionner une de ces surfaces en temps, placez l’extrémité de n’importe quel outil (sauf le marqueur) sur le bord de l’élément de piste correspondant, il se transforme en deux petits triangles noirs, puis en cliquant, vous étirez ou réduisez l’élément horizontalement. 83 19 Définition et paramètres des traitements La manipulation sur la surface elle-même est impossible. Mais il est possible de modifier la fréquence la plus haute, la fréquence la plus basse, la largeur fréquentielle en changeant la valeur des paramètres correspondants dans la fenêtre "Inspector" (ainsi que le gain, la durée, etc). Pour changer le gain de plusieurs surfaces sélectionnées, utilisez l’une des méthodes décrites à la section 19.2.4.7. Les fonctions "Replicate in Frequency. . . " et "Replicate in Time. . . " du menu "Edit" ainsi que "Invert" du menu "Treatments" sont actives pour une ou plusieurs surfaces sélectionnées (voir section 19.2.4). Important : Si deux surfaces se chevauchent, il sera préférable d’utiliser le mode "Maximum" de "Filter Superposition mode" dans le panneau de réglages "Processing Parameters" appelé par "Process Treatments. . . " (voir section 25.1.2). Ce réglage est aussi disponible dans les préférences, onglet "Filter". 19.2.3 Le crayon Pour ce traitement, l’affichage du sonagramme semble indispensable. Dans la palette d’outils ("Tools"), choisissez l’outil crayon et en même temps l’épaisseur du trait (si le défaut ne convient pas) : 84 19 Définition et paramètres des traitements Par défaut, l’épaisseur du trait est de 6 pixels et l’atténuation de - 50 dB. Note : Ces deux valeurs par défaut peuvent être modifiées : il suffit d’aller dans les préférences et de cliquer sur l’onglet "PencilTool". Note : En maintenant la touche "majuscule temporaire" ("shift") enfoncée, vous pouvez tirer des traits droits horizontaux et verticaux. Note : Les traits verticaux ne sont pas pris en compte s’ils ne sont pas assez épais. Cela dépend du pas d’avancement (voir section 25.1.1). Note : En maintenant la touche "Option" ("alt") enfoncée, vous inversez la valeur du crayon : le gain change de signe. Sur le sonagramme, tracez un trait : Cet élément se comporte EXACTEMENT comme une surface rectangulaire : sur le sonagramme, déplacement horizontal et vertical, redimensionnement horizontal et vertical. L’élément de piste correspondant s’affiche sur une piste du séquenceur. Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la manière habituelle. Déplacement, duplication, suppression et sauvegarde par "glisser-déposer" ("Drag and Drop") sur le bureau de ces surfaces se font de la même manière que pour les autres surfaces. Vous pouvez aussi modifier ce traitement en utilisant la palette "Inspector" : paramètres temporels et fréquentiels du rectangle ainsi que gain et épaisseur du trait ("Line Height" en Hz) sont accessibles. 85 19 Définition et paramètres des traitements Pour donner une autre valeur (en dB) à un trait de crayon, il suffit d’utiliser l’une des méthodes décrites pour les surfaces rectangulaires. Reportez vous à la section 19.2.1. Pour changer le gain de plusieurs traits de crayon sélectionnés, utilisez l’une des méthodes décrites à la section 19.2.4.7. Les fonctions "Replicate in Frequency. . . " et "Replicate in Time. . . " du menu "Edit" ainsi que "Invert" du menu "Treatments" sont actives pour une ou plusieurs surfaces sélectionnées (voir section 19.2.4). Important : Il faut bien comprendre que CHAQUE trait de crayon est UNE surface et que si deux traits se croisent ou se chevauchent, les gains s’additionnent si vous restez dans le mode "Multiply". Il sera donc préférable d’utiliser le mode "Maximum" de "Filter Superposition mode" dans le panneau de réglages "Processing Parameters" appelé par "Process Treatments. . . " (voir section 25.1.2). Ce réglage est aussi disponible dans les préférences, onglet "Filter". Note : Il est assez probable qu’avec le crayon, des éléments de piste se superposent sur la même piste. Il faut alors cocher l’item "Create Tracks When Needed" du menu "Treatments" (voir section 21.2). 19.2.4 Points communs à toutes les surfaces (rectangle, libre et crayon) Voir aussi la section 19.5 : "Points communs à tous les traitements". 19.2.4.1 Rappel Déplacement, duplication, suppression et sauvegarde par "glisser-déposer" peuvent s’appliquer à un nombre quelconque de surfaces de tout type. 86 19 Définition et paramètres des traitements 19.2.4.2 Sélection de plusieurs surfaces Vous pouvez, comme décrit ci-dessus, les sélectionner en cliquant dessus avec n’importe quel outil (sauf l’outil marqueur) sur la piste ou avec l’outil pointeur (sur le sonagramme) tout en maintenant la touche "majuscule temporaire" ("shift") enfoncée. La sélection de plusieurs surfaces sur le sonagramme peut se faire de la même manière que sur le Finder avec l’outil pointeur en dessinant un rectangle les englobant. Elle peut se faire aussi avec l’outil lasso (il n’est pas nécessaire de les englober totalement). 19.2.4.3 Suppression de plusieurs surfaces Pour supprimer une ou plusieurs surfaces sélectionnées, il suffit d’appuyer sur la touche "delete" (touche "<-" ou "Backspace") ou de choisir "Clear" dans le menu "Edit". Il faut noter que cette action est valable pour n’importe quels traitements sélectionnés. 19.2.4.4 Déplacement de surfaces Vous pouvez déplacer comme vous le voulez la ou les surfaces sélectionnées placée(s) sur le sonagramme avec l’outil pointeur ou l’outil main : le rectangle de la piste (élément de piste) suit. La touche "shift" (majuscule temporaire) enfoncée permet de contraindre un déplacement horizontal ou vertical. Vous pouvez agir de la même manière, mais uniquement horizontalement, sur les éléments de piste à l’aide de n’importe quel outil (sauf l’outil marqueur). Il faut noter que cette action sur les éléments de piste est valable pour n’importe quels traitements sélectionnés. 19.2.4.5 Duplication de surfaces En appuyant sur la touche "Option" ("alt"), l’outil pointeur (ou l’outil main) permet de dupliquer la ou les surfaces sélectionnées et de placer la copie à l’endroit où vous le souhaitez : en dupliquant sur la piste, vous choisissez uniquement la position temporelle de la copie, en dupliquant sur le sonagramme, vous choisissez la position temporelle et la position en fréquence de la copie. Il faut noter que cette action est valable pour n’importe quels traitements sélectionnés. 19.2.4.6 Redimensionnement de surfaces Pour redimensionner une surface, placez l’extrémité de l’outil pointeur sur un bord de celleci, il se transforme en deux petits triangles noirs, puis en cliquant, vous étirez ou réduisez la surface horizontalement suivant le bord utilisé. Il est possible d’agir verticalement, sur les surfaces de type rectangle et crayon. La même manipulation sur la piste avec n’importe quel outil (sauf l’outil marqueur) permet la modification en temps. Note : cette manipulation ne peut agir que sur une seule surface à la fois. 87 19 Définition et paramètres des traitements 19.2.4.7 Gain Il est possible de donner un même gain en même temps à plusieurs surfaces (rectangulaires, libres, crayon). Sélectionnez les éléments voulus d’une des manières décrites ci-dessus, puis utilisez l’une des méthodes suivantes : • Première méthode : un double-clic sur un élément de piste avec n’importe quel outil (sauf l’outil marqueur) ouvre la boîte de dialogue "Edit Gain" (ou "Edit Pencil Filter", si le dernier élément sélectionné est un trait de crayon) dans laquelle vous tapez votre valeur que vous validez par le bouton "OK". Un double-clic sur l’une des surfaces dessinées sur le sonagramme avec l’outil pointeur (ou main, ou curseur de sélection, ou rectangle) produit le même effet. • Seconde méthode : positionnez l’un des outils suivants (pointeur (flèche), main, curseur de sélection ou rectangle) sur la surface placée sur le sonagramme. En appuyant sur la touche "ctrl" ("contrôle"), puis en maintenant le bouton de la souris enfoncé et en déplaçant celle-ci, vous faites défiler les valeurs. • Troisième méthode : dans le menu "Edit", choisissez l’item "Change Gain. . . ", la boîte de dialogue "Edit Gain" s’ouvre, vous invitant à rentrer votre valeur que vous validez par le bouton "OK". Note : Les valeurs limites sont -116 dB et +116 dB (si vous outrepassez ces limites, le nombre pris en compte sera -116 dB ou +116 dB). La couleur des surfaces dépend de la valeur du gain : plus ou moins bleue pour une valeur positive et plus ou moins rouge pour une valeur négative. 19.2.4.8 Chevauchement de surfaces Il faut bien comprendre que si deux ou plusieurs surfaces se chevauchent, les gains s’additionnent si vous restez dans le mode "Multiply". Il sera donc préférable d’utiliser le mode "Maximum" de "Filter Superposition mode" dans le panneau de réglages "Processing Parameters" appelé par "Process Treatments. . . " (voir section 25.1.2). Ce réglage est aussi disponible dans les préférences, onglet "Filter". 19.2.4.9 "Replicate in Frequency. . . " Cette fonction se trouve dans le menu "Edit" et permet de dupliquer la ou les surfaces sélectionnées suivant l’axe fréquentiel. 88 19 Définition et paramètres des traitements Il faut choisir le nombre de répliques et leur décalage en fréquence vers le haut ou vers le bas en Hertz ou en "cents" (centième de 1/2 ton) ou en intervalle. La case à cocher "Harmonic Compensation" permet d’ajuster automatiquement les fréquences de la réplique. Il faut noter que les éléments de piste se superposent, si l’item "Create Tracks When Needed" du menu "Treatments" n’est pas coché (voir section 21.2). On remarque aussi que les répliques sont sélectionnées. On ne pourra changer le gain de chacune des répliques qu’en les désélectionnant d’abord (en cliquant sur l’original avec le pointeur ou le curseur de sélection), puis en les sélectionnant une à une avec le même outil. Chacune d’elles pourra être déplacée horizontalement (et même verticalement, mais cela est-il vraiment nécessaire, puisqu’il s’agit de répliques en fréquence ?). Il faut noter que cette fonction n’est valable que pour les surfaces et le crayon. 19.2.4.10 "Replicate in Time. . . " Cette fonction se trouve dans le menu "Edit" et permet de dupliquer la ou les surfaces sélectionnées suivant l’axe temporel. 89 19 Définition et paramètres des traitements Il faut choisir le nombre de répliques et leur décalage en temps vers la droite (temps positif en seconde) ou vers la gauche (temps négatif en seconde). La case à cocher "Align to markers" ne peut l’être que s’il existe des marqueurs, bien sûr. Elle permet de d’aligner les répliques sur les marqueurs situés à une position supérieure (ou égale) au décalage voulu. 90 19 Définition et paramètres des traitements Important : Si le nombre de répliques demandées est supérieur au nombre de marqueurs utilisables, les répliques supplémentaires vont se superposer sur le dernier. Il faut noter que cette fonction est valable pour n’importe quel traitement. 19.2.4.11 "Expand To Markers" Cette fonction se trouve dans le menu "Edit" (raccourci clavier : X) et permet d’étendre la (ou les) surfaces sélectionnées aux marqueurs les plus proches, à gauche et à droite. 91 19 Définition et paramètres des traitements 19.2.4.12 "Expand To Grid" Cette fonction se trouve dans le menu "Edit" (raccourci clavier : "shift"+X) et permet d’étendre la (ou les) surfaces sélectionnées aux repères de la grille les plus proches, à gauche et à droite. 19.2.4.13 "Invert" Cette fonction se trouve dans le menu "Treatments" et permet de changer le signe du gain de la ou des surfaces sélectionnées. 92 19 Définition et paramètres des traitements Il faut noter que cette fonction est valable pour n’importe quel traitement (voir plus bas) sauf le "Clipping Filter". Elle agira, suivant le cas, sur le gain ou un autre paramètre. 19.2.4.14 "Glisser-déposer" ("Drag and Drop") Le "glisser-déposer" ("Drag and Drop") d’une ou plusieurs surfaces sélectionnées (ou des éléments de piste correspondants) sur le bureau permet de sauvegarder toutes les caractéristiques de ces surfaces (positions horizontales et verticales ainsi que les gains correspondants) : le traitement prend le nom de "extrait de AudioSculpt" (si l’extension de fichier est demandée : "extrait de AudioSculpt.textClipping"). Pour réutiliser ce traitement à l’identique sur n’importe quel son, il suffit de déposer cet "extrait de AudioSculpt" sur le sonagramme (voir section 5.2). Vous pouvez renommer ces extraits comme bon vous semble. Note : Ces extraits se numérotent automatiquement par incrémentation. Il faut noter que cette action est valable pour n’importe quels traitements sélectionnés. 19.3 Les autres traitements "à paramètres constants" Si aucune partie du son n’est sélectionnée, le traitement sera défini sur la totalité du son. Les traitements proposés se trouvent dans la première partie du menu "Treatments") : 93 19 Définition et paramètres des traitements • Constant Transposition : applique une transposition constante avec ou sans correction de temps. • Constant TimeStretch : applique une variation dans le domaine temporel, définie par un coefficient constant. • Freeze: permet de "geler" un son. • Reverse/Repeat : déplacement dans le son. • Constant Formant Filter : filtrage constant de type formantique. • Band Filter : filtrage de type "Bande" (bandes passantes ou réjection de bandes). • Clipping Filter : filtrage par "Clipping". • Image Filter : filtrage de type "Clipping" par une image. 19.3.1"Constant Transposition" : transposition invariable dans le temps Dans le menu "Treatments", faites "Add Constant Transposition. . . ". La boîte de dialogue suivante s’ouvre et vous permet de choisir vos paramètres. Le choix préalable de "Up" ou "Down" détermine le signe de la transposition. Le choix se fait en "cents" (centième de demi-ton) ou en intervalle. Une case à cocher vous permet d’opter pour la correction temporelle ou non (correction temporelle : "Time Correction", cochée par défaut). Dans ce cas, vous pouvez choisir la préservation de l’enveloppe spectrale ou non ("Preserve envelope" est coché par défaut). Ces options sont disponibles dans la fenêtre "Inspector". 94 19 Définition et paramètres des traitements La transposition est limitée à + ou - 5 octaves, ce qui est considérable. En dessous, une ligne grisée indique de combien serait le facteur de dilatation/compression pour obtenir la même transposition sans correction temporelle. Si vous désactivez la correction temporelle, le champ correspondant au coefficient de dilatation/compression devient accessible, permettant de définir la transposition correspondante (la valeur en "cents" est indiquée plus haut). La valeur prise en compte dépend du choix du signe de la transposition (par coche de "Up" ou "Down") En même temps apparaît sur une piste du séquenceur, le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). Pour modifier la transposition, il faut rouvrir la boîte de dialogue en double-cliquant sur l’élément de la piste. Il est possible de régler le mode avec ou sans correction de temps pour chacune des transpositions. Le choix se fait, pour chaque traitement dans la boîte de dialogue habituelle ou dans la fenêtre "Inspector" (par bascule on/off en face de "Time Correction"). Le même choix est possible pour "Preserve Envelope", si "Time Correction" est activé. 95 19 Définition et paramètres des traitements Dans le panneau de réglage ouvert par "Process Treatments. . . ", "Process Selection. . . " ou "Realtime Processing Settings. . . " (menu "Processing"), l’option "Preserve Transient" permet la détection des transitoires pour améliorer les transpositions (ainsi que les dilatations/compressions). Cette option fonctionne avec des paramètres prédéfinis. La détection des transitoires n’est possible qu’en mode "Phase Synchronous Processing" (voir section 25.1.2). Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la même manière que les éléments "surface" (voir section 19.5). Vous pouvez aussi modifier votre traitement en utilisant la palette "Inspector" dans laquelle vous éditerez les paramètres voulus (voir section 12). Les fonctions "Replicate in Time. . . " (menu "Edit") et "Invert" (menu "Treatments") sont actives. La fonction "Invert" change le signe de la transposition. 19.3.2 "Constant TimeStretching" : dilatation/compression à facteur constant Dans le menu "Treatments", faites "Add Constant TimeStretch. . . ". La boîte de dialogue suivante s’ouvre et vous permet de choisir le coefficient de dilatation/compression. Les valeurs limites sont 0,01 pour la compression et 1000 pour la dilatation (si vous outrepassez ces limites, le nombre sera corrigé automatiquement). En même temps apparaît sur une piste du séquenceur, le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). 96 19 Définition et paramètres des traitements Pour modifier le coefficient, il faut rouvrir la boîte de dialogue en double-cliquant sur l’élément de la piste. Dans le panneau de réglage ouvert par "Process Treatments. . . ", "Process Selection. . . " ou "Realtime Processing Settings. . . " (menu "Processing"), l’option "Preserve Transient" permet la détection des transitoires pour améliorer les dilatations/compressions (ainsi que les transpositions). Cette option fonctionne avec des paramètres prédéfinis. La détection des transitoires n’est possible qu’en mode "Phase Synchronous Processing" (voir section 25.1.2). Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la même manière que les éléments surface (voir section 19.5). Vous pouvez aussi modifier votre traitement en utilisant la palette "Inspector" dans laquelle vous éditerez les paramètres voulus (voir section 12). Les fonctions "Replicate in Time. . . " (menu "Edit")et "Invert" (menu "Treatments") sont actives. La fonction "Invert" donne le coefficient inverse : y = 1/x (2 pour 0,5 par exemple). 19.3.3"Freeze" : gel du son en un point Ce traitement s’applique en un point du son. Celui-ci se trouvera rallongé de la durée du "gel". Dans le menu "Treatments", l’item "Add Freeze. . . " ouvre le panneau permettant de régler la durée du son "gelé". La portion de son sur laquelle s’applique l’analyse pour ce "gel" est déterminée par la sélection ("History duration"). Ce "gel" s’applique à la fin de la sélection. En même temps apparaît sur une piste du séquenceur, le rectangle de même durée ("History 97 19 Définition et paramètres des traitements duration") portant l’icône correspondant au traitement (élément de piste). Pour modifier le traitement, il faut rouvrir le panneau de réglage "Freeze" en double-cliquant sur l’élément de la piste. La palette "Inspector" permet de modifier les paramètres : point de départ de l’analyse ("History start"), endroit du gel ("Freeze point"), durée de l’analyse ("History duration"), et durée du gel ("Freeze duration"). Le résultat : La fonction "Replicate in Time. . . " (menu "Edit") est active. La fonction "Invert" n’est pas active. 19.3.4 "Reverse/Repeat" : lecture en avant et/ou en arrière avec répétition Ce traitement s’applique sur tout ou partie du son. Il s’agit de lire le son en avant et/ou en arrière avec ou sans répétition. Le son résultant est enregistré avec ces nouvelles lectures. Il est donc rallongé d’autant. SuperVP permet de réaliser ce traitement sans clic, ni discontinuité. Dans le menu "Treatments", l’item "Add Reverse/Repeat. . . " ouvre le panneau permettant de régler le mode ("Reverse Mode") : 98 • "Backwards" : en arrière • "Back And Forth" : en arrière et en avant • "Forward" : en avant • "Forth And Back" : en avant et en arrière, et le nombre de trajets ("Repeat Count") 19 Définition et paramètres des traitements Important : il faut bien comprendre qu’un trajet est un aller OU un retour. Exemple : mode "Forth And Back" avec "Repeat Count" = 1 ne changera rien au son, car la lecture ne fera que 1 trajet en avant sur la sélection. En même temps apparaît sur une piste du séquenceur, le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). Pour modifier le traitement, il faut rouvrir le panneau de réglage "Reverse/Repeat" en doublecliquant sur l’élément de la piste. Tous les paramètres sont aussi modifiables dans la palette "Inspector". La fonction "Replicate in Time. . . " (menu "Edit") est active. La fonction "Invert" n’est pas active. 19.3.5 "Constant Formant Filter" : filtre formantique Un filtre formantique est modelé sur les formants vocaux : il est donc formé de pics positifs. Si vous augmentez le gain d’un formant, tout est augmenté en proportion. De la même manière, si vous diminuez le gain d’un formant, tout est diminué en proportion. 99 19 Définition et paramètres des traitements Dans le menu "Treatments", faites "Add Constant Formant Filter. . . ". La boîte de dialogue "Formant Filter" s’ouvre et vous permet de choisir vos paramètres. Sur une piste apparaît le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). Pour modifier le traitement, il faut rouvrir la boîte de dialogue en double-cliquant sur l’élément de la piste. Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la même manière que les autres éléments (voir section 19.5). Vous pouvez aussi modifier votre traitement en utilisant la palette "Inspector". Mais vous n’avez accès qu’à la position temporelle, à la durée et au gain. Seule la fonction "Replicate in Time. . . " (menu "Edit") est active. La fonction "Invert" n’est pas active. 19.3.6 "Band Filter" : filtre par bande Dans le menu "Treatments", faites "Add Band Filter. . . ". La boîte de dialogue suivante s’ouvre et vous permet de choisir vos paramètres. 100 19 Définition et paramètres des traitements Sur une piste apparaît le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). Vous pouvez modifier les bandes comme vous le souhaitez. Il est possible de déplacer un point à l’aide de l’outil pointeur : celui-ci se transforme en croix de couleur rouge lorsqu’il passe sur l’un d’eux. Il suffit de cliquer dessus et de le déplacer. Il est possible de créer une paire de points à un instant donné à l’aide de l’outil pointeur : celui-ci se transforme en croix de couleur noire lorsqu’il passe sur une ligne limitant une bande. Il suffit de cliquer dessus et de le déplacer. Pour supprimer une paire de points, il suffit de placer le pointeur sur l’un d’eux, il se transforme en croix de couleur rouge. Il faut alors cliquer en maintenant la touche "Option" ("alt") enfoncée. Les bandes peuvent se croiser. Si vous rouvrez la boîte de dialogue en double-cliquant sur l’élément de piste, vous ne pouvez opter qu’entre "Band Pass" et "Band Reject" sans changer les bandes. Vous obtenez le même résultat avec la fonction "Invert". 101 19 Définition et paramètres des traitements Mais si vous choisissez "More Options", AudioSculpt vous prévient que vous perdez tous les changements précédemment faits. 102 19 Définition et paramètres des traitements Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la même manière que les autres éléments. Vous pouvez aussi déplacer la sélection sur le sonagramme verticalement avec l’outil pointeur. Vous pouvez également modifier les paramètres temporels en utilisant la palette "Inspector". Les fonctions "Replicate in Time. . . " (menu "Edit") et "Invert" (menu "Treatments") sont actives. La fonction "Invert" inverse "Band Pass" et "Band Reject". 19.3.7 "Clipping Filter" : filtre par "Clipping" Le filtrage par "Clipping" permet d’effectuer un filtrage par seuil, dépendant des seuils de niveaux de gris du sonagramme : il est donc nécessaire de calculer et d’afficher celui-ci au préalable. Dans le menu "Treatments", l’item "Add Clipping Filter. . . " ajoute un élément de piste "Clipping". Un double-clic sur celui-ci ouvre le panneau de réglage "Edit Clipping Filter". Le réglage de l’affichage du sonagramme, et donc du filtrage, se fait à l’aide des potentiomètres linéaires "Upper Threshold" et "Lower Threshold". Les réglages par défaut sont : -10 dB pour le noir et -60 dB pour le blanc. Ce sont les mêmes valeurs que l’affichage par 103 19 Définition et paramètres des traitements défaut du sonagramme. En cochant la case "Preview Sonogram", vous pouvez apprécier visuellement le type de changement opéré (sur tout le sonagramme, mais le traitement ne s’effectuera que sur la partie sélectionnée, si sélection il y a). La case à cocher "Renormalize" permet de compenser la perte de niveau du signal par rapport au reste. En même temps apparaît sur une piste du séquenceur, le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). Sonagramme original : Réglage des seuils : Pour modifier le traitement, il faut rouvrir le panneau de réglage "Edit Clipping Filter" en double-cliquant sur l’élément de la piste. Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la même manière que les éléments surface (voir section 19.5). Vous pouvez aussi modifier votre traitement en utilisant la palette "Inspector" dans laquelle vous éditerez les paramètres voulus (voir section 12). La fonction "Replicate in Time. . . " (menu "Edit") est active. La fonction "Invert" n’est pas active. 104 19 Définition et paramètres des traitements 19.3.8 "Image Filter" : filtrage par une image Il s’agit de déposer une image sur tout ou partie du sonagramme et de l’utiliser comme filtre à niveau de gris. Dans le menu "Treatments", l’item "Add Image Filter. . . " ouvre la fenêtre de dialogue standard permettant de naviguer dans l’arborescence des disques durs et d’y choisir une image (photo, dessin. . . ) à importer. Celle-ci peut être en couleur ou en nivaux de gris au format JPEG, PICT, TIFF, PDF. . . tout format supporté par QuickTime. L’image choisie s’affiche en nivaux de gris à l’endroit voulu sur le sonagramme. Elle peut être déformée selon la région délimitée sur le sonagramme. Cette image à les même propriétés qu’un surface rectangulaire : redimensionnement en hauteur et en largeur et déplacement en tout sens sur le sonagramme (voir sections 19.2.4.4 et 19.2.4.6). En même temps apparaît sur une piste du séquenceur, le rectangle de même durée portant l’icône correspondant au traitement (élément de piste). Un double-clic sur l’élément de piste correspondant ouvre le panneau de réglage "Edit Image Filter". En haut, à gauche, on retrouve le nom de l’image choisie. A droite, le bouton "Select" permet de choisir une autre image. On retrouve les mêmes potentiomètres linéaires ("Upper Threshold" et "Lower Threshold") que pour le "Clipping" permettant de régler les seuils de noir et de blanc. Par contre, les réglages par défaut (exprimés là en pourcentage) sont : 100 % pour "Upper 105 19 Définition et paramètres des traitements Threshold" et 0 % pour "Lower Threshold", respectant la dynamique de l’image. Si l’image ne couvre pas la totalité de la plage fréquentielle, les fréquences non recouvertes sont supprimées (réglage par défaut). L’option (case à cocher) "Pass frequencies outside of the image’s frequency range" permet de ne pas les supprimer. Pour modifier le traitement, il faut rouvrir le panneau de réglage "Edit Image Filter" en doublecliquant sur l’élément de la piste. Tous les paramètres sont aussi modifiables dans la palette "Inspector", sauf le choix de l’image. La fonction "Replicate in Time. . . " (menu "Edit") est active. La fonction "Invert" (menu "Treatments") est active : elle donne le négatif de l’image. 19.4 Les traitements dits "par Bpf" Si aucune partie du son n’est sélectionnée, le traitement sera défini sur la totalité du son. 19.4.1 L’éditeur de Bpf Une Bpf (Breakpoint Function) est une courbe définie de manière discrète par une ensemble de points reliés par des segments de droite. L’éditeur de Bpf est l’éditeur utilisé par Diphone. Reportez vous à la documentation, accompagnant Diphone, présente sur le CDRom : "Diphone_Studio-Français.pdf" (section "2.6 Actions sur les Bpf"), et sa mise à jour, "Diphone 4r2n MAJ-F.pdf" (section "21 : L’éditeur de Bpf indépendant"). Chaque Bpf est identifiée par le nom "son, type de Bpf, temps de début et temps de fin". Le nom de la fenêtre est utile pour l’identifier et la retrouver, grâce au menu "Window", parmi vos nombreuses fenêtres ouvertes. Pour modifier une Bpf, il faut rouvrir la fenêtre de l’éditeur en double-cliquant sur l’élément de la piste (ou la surface correspondante du sonagramme). Les modifications se font comme pour toute Bpf : modifications grâce au crayon, à la gomme, aux "Bpf Tools". 106 19 Définition et paramètres des traitements Note : En maintenant la touche "Option" ("alt") enfoncée, vous contraignez le crayon à tracer des segments de droite (horizontaux ou obliques). Une petite ligne apparaît à côté du crayon. Si la Bpf n’est pas assez précise, en particulier pour le filtrage par Bpf ("Breakpoint Filter"), il est possible d’en changer l’échantillonnage grâce à l’item "Resampling" du menu Bpf. N’oubliez pas le petit outil bien "utile" qui permet de redimensionner une fenêtre Bpf. Si plusieurs traitements par Bpf sont sélectionnés (identiques ou différents), seule la Bpf correspondant à l’élément de piste sur lequel vous double-cliquez s’ouvrira. Sur le sonagramme, le double-clic ouvrira la Bpf correspondant au dernier traitement sélectionné. 19.4.2 "Dynamic Transposition" : transposition variable dans le temps Dans le menu "Treatments", l’item "Add Dynamic Transposition. . . " ouvre l’éditeur de Bpf permettant définir le coefficient de transposition en fonction du temps. Cette fenêtre (et donc la Bpf) est identifiée par le nom "son, type de Bpf, temps de début et temps de fin" (ici "0.6_1.8") : vous pouvez y dessiner et manipuler la Bpf représentant votre coefficient variable. Le nom de la fenêtre est utile pour l’identifier et la retrouver, grâce au menu "Window", parmi vos nombreuses fenêtres ouvertes. L’axe horizontal représente le temps et l’axe vertical, la transposition en "cents" (centième de 1/2 ton) ou en 1/2 ton. L’éditeur limite la transposition à + ou - 5 octaves, ce qui est considérable (réfléchissez à ce que vous voulez faire !). L’élément de piste correspondant se place sur une piste du séquenceur. 107 19 Définition et paramètres des traitements La palette "Inspector" donne accès aux paramètres : début, fin et durée ainsi que correction temporelle et préservation de l’enveloppe spectrale. Il est possible de régler le mode avec ou sans correction de temps pour chacune des transpositions. Le choix se fait, pour chaque traitement, dans la fenêtre "Inspector" (par bascule on/off en face de "Time Correction"). Le même choix est possible pour "Preserve envelope", si "Time Correction" est activé. Pour modifier la Bpf, il faut rouvrir la fenêtre en double-cliquant sur l’élément de la piste (ou la surface correspondante du sonagramme). Les modifications se font comme pour toute Bpf. Si plusieurs traitements par Bpf sont sélectionnés (identiques ou différents), seule la Bpf correspondant à l’élément de piste sur lequel vous double-cliquez s’ouvrira. Sur le sonagramme, le double-clic ouvrira la Bpf correspondant au dernier traitement sélectionné. Les fonctions "Replicate in Time. . . " (menu "Edit") et "Invert" (menu "Treatments") sont actives. La fonction "Invert" donne la transposition opposée. 19.4.3 "Dynamic TimeStretching" : dilatation/compression Dans le menu "Treatments", faites "Add Dynamic TimeStretch. . . " : le processus est le même que pour "Dynamic Transposition". 108 19 Définition et paramètres des traitements L’axe horizontal représente le temps et l’axe vertical le coefficient de compression/dilatation. L’éditeur limite le coefficient à -0,01 pour la compression et à 10 pour la dilatation. L’élément correspondant se place sur une piste du séquenceur. Pour modifier la Bpf, il faut rouvrir la fenêtre en double-cliquant sur l’élément de la piste (ou la surface correspondante du sonagramme). Les modifications se font comme pour toute Bpf. La palette "Inspector" donne accès aux paramètres : début, fin et durée. Les fonctions "Replicate in Time. . . " et "Invert" sont actives. La fonction "Invert" donne la Bpf inverse. 19.4.4 "Breakpoint for Gain" : modification du gain variable dans le temps Dans le menu "Treatments", l’item "Add Breakpoint for Gain. . . " permet d’éditer une Bpf pour modifier le gain du signal. L’axe horizontal représente le temps et l’axe vertical le gain en dB (amplitude logarithmique). L’éditeur limite le gain à +116 dB et l’atténuation à -116 dB. Note : Il est prudent de vérifier que la normalisation est activée en cas d’augmentation du gain. 109 19 Définition et paramètres des traitements L’élément de piste correspondant se place sur une piste du séquenceur. La palette "Inspector" donne accès aux paramètres : début, fin et durée. Pour modifier la Bpf, il faut rouvrir la fenêtre en double-cliquant sur l’élément de la piste (ou la surface correspondante du sonagramme). Les modifications se font comme pour toute Bpf. Les fonctions "Replicate in Time. . . " et "Invert" sont actives. La fonction "Invert" donne la Bpf opposée. 19.4.5 "Breakpoint Filter" : filtre par Bpf Dans le menu "Treatments", faites "Add Breakpoint. . . " : s’ouvre alors la fenêtre de l’éditeur de Bpf dans laquelle vous pouvez dessiner et manipuler la Bpf représentant votre filtre. Les fréquences sont sur l’axe horizontal et l’amplitude (amplitude logarithmique en dB) sur l’axe vertical. L’éditeur limite le gain à +116 dB et l’atténuation à -116 dB. Note : Si la Bpf n’est pas assez précise, il est possible d’en changer l’échantillonnage grâce à l’item "Resampling" du menu Bpf. En même temps apparaît sur une piste du séquenceur le rectangle de même durée portant 110 19 Définition et paramètres des traitements l’icône correspondant au traitement. Pour modifier la Bpf, il faut rouvrir la fenêtre en double-cliquant sur l’élément de la piste (ou la surface correspondante du sonagramme). Les modifications se font comme pour toute Bpf. Vous pouvez déplacer ou redimensionner temporellement ou bien dupliquer le rectangle (donc le traitement) sur la piste de la même manière que pour les autres éléments. La palette "Inspector" donne accès aux paramètres : début, fin et durée. Les fonctions "Replicate in Time. . . " et "Invert" sont actives. La fonction "Invert" change le signe du gain (Bpf opposée). 19.4.6 "Dynamic Formant" : filtre formantique variable Ce traitement n’est pas encore opérationnel. 19.5 Points communs à tous les traitements 19.5.1 Normalisation Par défaut, la normalisation en sortie de traitement n’est pas activée. Il vous faudra donc faire attention lorsque vous appliquez des traitements qui augmentent le gain. L’activation de la normalisation se fait dans le panneau "Processing Parameters" appelé par "Process Treatments. . . " ou "Process Selection. . . " du menu "Processing" (voir section 25.1.2). La normalisation est activée par défaut pour "Source Filter Synthesis" et "Generalized CrossSynthesis" (voir sections 23.1 et 23.2). Vous pouvez la désactiver dans les panneaux de réglage correspondants. Note : Le mode temps réel ("Real Time Processing") a un comportement différent. Reportez vous à la section 28. 111 19 Définition et paramètres des traitements 19.5.2 Remarque importante Ce qui suit ne concerne pas les traitements particuliers (voir section 23) que sont : "Source Filter Synthesis", "Generalized Cross-Synthesis", "Normalize" et "Samplerate Conversion" du menu "Processing". 19.5.3 Rappel Déplacement, duplication, suppression et sauvegarde par "glisser-déposer" ("Drag and Drop") peuvent s’appliquer à un nombre quelconque de traitements de tout type. Pour agir sur un ou plusieurs traitements de n’importe quel type, il faut utiliser les éléments de piste du séquenceur. Certains paramètres sont modifiables directement dans la palette "Inspector". 19.5.4 Sélection de plusieurs traitements Pour sélectionner plusieurs traitements, il suffit de cliquer sur les éléments de piste avec n’importe quel outil (sauf l’outil marqueur) tout en maintenant la touche "majuscule temporaire" enfoncée. Dans le menu "Edit", l’item "Select All Treatments" permet de sélectionner la totalité des traitements définis. 19.5.5 Suppression de plusieurs traitements Pour supprimer un ou plusieurs traitements sélectionnés, il suffit d’appuyer sur la touche "delete" (touche "<-" ou "Backspace") ou de choisir "Clear" dans le menu "Edit". 19.5.6 Déplacement de traitements Vous pouvez déplacer horizontalement le ou les traitements sélectionnés en agissant sur l’un des éléments de piste sélectionné à l’aide de n’importe quel outil (sauf le marqueur). 19.5.7 Duplication de traitements En appuyant sur la touche "Option" ("alt"), l’outil pointeur (ou l’outil main) permet de dupliquer le ou les traitements sélectionnés et de placer la copie à l’endroit de la piste où vous le souhaitez. Note : "Image Filter" semble se dupliquer, mais ne l’est pas réellement (l’image ne s’affiche pas). 19.5.8 Redimensionnement de traitement Pour redimensionner un traitement, placez l’extrémité de n’importe quel outil (sauf l’outil marqueur) sur un de l’élément de piste, il se transforme en deux petits triangles noirs, puis en cliquant, vous étirez ou réduisez le traitement horizontalement suivant le bord utilisé. 112 19 Définition et paramètres des traitements Note : cette manipulation ne peut agir que sur un seul traitement à la fois. 19.5.9 "Replicate in Time. . . " Cette fonction se trouve dans le menu "Edit" et permet de dupliquer le (ou les) traitement sélectionnés suivant l’axe temporel. Il faut choisir le nombre de répliques et leur décalage en temps vers la droite (temps positif en seconde) ou vers la gauche (temps négatif en seconde). La case à cocher "Align to markers" ne peut l’être que s’il existe des marqueurs, bien sûr. Elle permet de d’aligner les répliques sur les marqueurs situés à une position supérieure (ou égale) au décalage voulu. Important : Si le nombre de répliques demandé est supérieur au nombre de marqueurs utilisables, les répliques supplémentaires vont se superposer en s’alignant sur le dernier marqueur. 19.5.10 "Expand To Markers" Cette fonction se trouve dans le menu "Edit" (raccourci clavier : X) et permet d’étendre le (ou les) traitements sélectionnés aux marqueurs les plus proches, à gauche et à droite. 19.5.11 "Expand To Grid" Cette fonction se trouve dans le menu "Edit" (raccourci clavier : "shift"+X) et permet d’étendre le (ou les) traitements sélectionnés aux repères de la grille les plus proches, à gauche et à droite. 19.5.12 "Invert" Cette fonction se trouve dans le menu "Treatments" et n’est active que si cela a un sens pour le traitement considéré. Elle n’est donc pas valable pour : • le "Clipping" • le filtrage formantique ("Constant Formant") • le "Freeze" • le "Reverse/Repeat" Elle agit, suivant le cas, sur le gain ou un autre paramètre. • Pour les surfaces : elle change le signe du gain. • Pour les transpositions : change le signe de la transposition ou donne la Bpf opposée. 113 19 Définition et paramètres des traitements • Pour les dilatations/compressions ("TimeStretching") : elle donne le coefficient inverse (y = 1/x) ou la Bpf inverse. • Pour le filtre par Bpf ("Breakpoint Filter") : change le signe du gain. • Pour le filtrage par une image ("Image Filter") : elle fait le négatif de celle-ci. • Pour le filtrage par bande ("Band Filter") : elle inverse "Band Pass" et "Band Reject". • Pour "Breakpoint for Gain" : elle donne la Bpf opposée. 19.5.13 "Glisser-déposer" ("Drag and Drop") Le "glisser-déposer" ("Drag and Drop") sur le bureau d’un ou plusieurs traitements sélectionnés permet de sauvegarder toutes les caractéristiques de ces traitements (positions horizontales et verticales, gains, coefficients, Bpf, etc) sont conservées : l’ensemble prend le nom de "extrait de AudioSculpt" ou de "extrait de AudioSculpt.textClipping". Pour réutiliser ce traitement ou cet ensemble de traitements à l’identique sur n’importe quel son, il suffit de déposer cet "extrait de AudioSculpt.textClipping" sur le sonagramme (voir section 5.2). Vous pouvez renommer ces extraits comme bon vous semble. Note : Ces extraits se numérotent automatiquement par incrémentation. 19.5.14 Traitements multiples Vous pouvez remarquer que les traitements peuvent se chevaucher. Ils peuvent se recouvrir et être définis dans n’importe quel ordre. AudioSculpt les utilisera tous pour traiter le son en une seule fois. Note : Il est préférable d’effectuer le moins possible de passages dans SuperVP. Il est donc conseillé de sauvegarder vos traitements (voir section 19.5.15) dans leur ensemble pour pouvoir ainsi les modifier et les appliquer à nouveau au son original (ou à un autre son). Note : N’oubliez pas de réfléchir avant de faire se chevaucher des traitements qui peuvent être plus ou moins contradictoires. 19.5.15 Sauvegarde et utilisation de fichiers sauvegardés Un fichier traitement représente l’ensemble des éléments de traitement définis sur un son (l’ensemble des éléments des pistes). Lorsque vous fermez une fenêtre AudioSculpt ou lorsque vous quittez l’application, une boîte de dialogue vous propose, si vous le désirez, de sauvegarder ce traitement, en choisissant son nom ("nom_du_son.trt" par défaut) et l’endroit. Le dossier proposé par défaut est celui nommé "Treatments" qui se trouve dans le dossier de l’application. Vous pouvez bien sûr choisir n’importe quel autre dossier. Il est recommandé de conserver l’extension ".trt". Il sera donc possible de recharger cet ensemble dans la fenêtre AudioSculpt de ce son lors de sa réouverture ou d’appliquer ce même ensemble de traitements à un autre son. Pour ce faire, après avoir ouvert un son, allez dans le menu "File" et faites "Open Treatment. . . " et choisissez, dans la boîte de dialogue standard, un fichier de type ".trt". Les traitements viennent s’afficher dans la fenêtre et éventuellement se rajouter aux traitements déjà posés. 114 19 Définition et paramètres des traitements Vous pouvez, à tout moment de votre travail, sauvegarder un tel fichier : allez dans le menu "File" et faites "Save Treatments" ou "Save Treatments As. . . " qui vous demande sous quel nom et à quel endroit vous désirez l’enregistrer (par défaut, le dossier "Treatments"). 19.6 Points communs à toutes les transpositions 19.6.1 Préservation des transitoires Voir la section 27 : "Détection et préservation des transitoires". 19.6.2 Correction temporelle Il est possible de régler le mode avec ou sans correction temporelle pour chacune des transpositions, quel qu’en soit le nombre, définies sur le son. Cela est valable aussi pour les transpositions variables dans le temps ("Dynamic Transposition"). Le choix se fait, pour chaque traitement, dans la fenêtre "Inspector" par bascule on/off en face de "Time Correction". Pour les transpositions constantes, le choix peut se faire aussi dans la boîte de dialogue habituelle. 19.6.3 Enveloppe spectrale Il est possible d’effectuer les transpositions avec correction de temps tout en préservant l’enveloppe spectrale. Le choix se fait, pour chaque traitement, dans la fenêtre "Inspector" par bascule on/off en face de "Preserve Envelope". Cette option est cochée par défaut. 115 19 Définition et paramètres des traitements 116 20 Sons multicanaux 20.1 Sons stéréophoniques ou bicanaux AudioSculpt travaille de la même manière que pour les sons monophoniques. La zone supérieure affiche la somme des deux canaux. Le son est joué en stéréophonie. AudioSculpt affiche les deux canaux et peut en faire les sonagrammes. Il en est de même pour les spectrogrammes. Le diapason montre les deux spectres en même temps (en bleu). Rappel : en rouge, les spectres de l’endroit où est situé le curseur. Pour les zones 2 (fenêtre dans le son) et 3 (sonagrammes), il est possible de cacher l’un ou l’autre des canaux en utilisant le bouton se trouvant à gauche des règles. 117 20 Sons multicanaux Les traitements s’appliquent au choix sur les deux canaux ou sur un seul (gauche ou droit). Ce réglage se trouve dans les boîtes de dialogue de : "Process Treatment. . . ", "Process Selection. . . ", et "Realtime Processing Settings. . . " du menu "Processing". 118 20 Sons multicanaux Certaines analyses se font sur les deux canaux ou sur un seul (gauche ou droit). D’autres analyses ne peuvent se faire que sur un seul canal à la fois. Ce réglage se trouve dans les boîtes de dialogue des analyses. Une dilatation sur un canal ajoutera du silence à la fin de l’autre. Une compression sur un canal ajoutera du silence à la fin de celui-ci. Le comportement est identique pour une sélection. Un "Freeze" sur un canal ajoutera du silence à la fin de l’autre. 20.2 Sons multicanaux (autres que stéréophoniques ou bicanaux) Le comportement est le même que pour les sons stéréophoniques. MAIS, AudioSculpt ne peut jouer que les deux premier canaux (en stéréophonie) sur le Mac seul. Mais si une carte son le permet, tous les canaux seront joués. Pour les zones 2 (fenêtre dans le son) et 3 (sonagrammes), il est possible de cacher un ou plusieurs canaux en utilisant le bouton se trouvant à gauche des règles. 119 20 Sons multicanaux Les traitements s’appliquent sur tous les canaux ou sur un seul canal au choix. Certaines analyses peuvent se faire sur tous les canaux ou sur un seul canal au choix. D’autres analyses ne peuvent se faire que sur un seul canal à la fois. Ce réglage se trouve dans les boîtes de dialogue des analyses. Une dilatation sur un canal ajoutera du silence à la fin des autres. Une compression sur un canal ajoutera du silence à la fin de celui-ci. Le comportement est identique pour une sélection. Un "Freeze" sur un canal ajoutera du silence à la fin des autres. 120 21 Le séquenceur 21.1 La zone du séquenceur Dans la fenêtre AudioSculpt, sous la zone du sonagramme, se trouve la zone du séquenceur (zone 5). Le petit triangle situé à gauche montre que cette zone est dépliée. A l’ouverture de la fenêtre AudioSculpt, elle ne montre qu’une seule piste (vide). Les pistes du séquenceur permettent de présenter les traitements avec leur durée dans leur organisation temporelle. 21.2 Les pistes du séquenceur Lorsque vous définissez un traitement quelconque (à l’exclusion de "Source Filter Synthesis", de "Generalized Cross-Synthesis", de "Normalize" et de "Samplerate Conversion" du menu "Processing"), un rectangle (élément de piste) de même durée portant l’icône correspondant à ce traitement se place sur la piste au temps voulu. Si vous avez défini successivement plusieurs traitements, ils se sont ajoutés sur la même piste. 121 21 Le séquenceur Vous pouvez créer autant de pistes que vous voulez avec l’item "New Track" du menu "File". Il est possible de forcer les éléments de piste à se placer sur une piste particulière : il suffit de sélectionner la piste voulue en cliquant dessus avec n’importe quel outil (sauf l’outil marqueur). Cette piste devient gris foncé. Lorsque l’item "Create Tracks When Needed" (menu "Treatments") est coché, une nouvelle piste n’est créée automatiquement que si nécessaire (c’est-à-dire pour qu’un traitement n’en cache pas un autre). Cela est particulièrement utile si vous utilisez de nombreux filtrages (ce qui est, en particulier, le cas avec le crayon). Il est possible de détruire une piste sélectionnée (et son contenu) avec l’item "Delete Selected Track" du menu "Edit". Vous pouvez faire de même en cliquant sur la piste voulue en maintenant la touche "contrôle" ("ctrl") enfoncée. Dans le pop-menu qui apparaît, choisissez le seul item proposé "Delete This Track". Note : Vous ne pouvez pas détruire toutes les pistes : il doit en rester au moins une. Avec n’importe quel outil (sauf l’outil marqueur), vous pouvez déplacer n’importe quel élément sur n’importe quelle piste. Cela est possible avec un nombre quelconque d’éléments 122 21 Le séquenceur sélectionnés. Pour bloquer la position temporelle d’un élément lors de son changement de piste, il suffit de maintenir la touche "majuscule temporaire" ("shift") enfoncée pendant le déplacement. Cela est possible avec un nombre quelconque d’éléments sélectionnés. L’en-tête d’une piste se présente comme suit : Chaque piste comporte 2 boutons, à gauche : les boutons "solo" et "mute" pour chaque piste. Ils ont la même fonction que dans un logiciel multipiste : • "mute" : désactive la piste (donc les traitements disposés sur cette piste), • "solo" : rend la piste active en désactivant les autres. Note : La fonction "mute" l’emporte sur la fonction "solo". Le bouton (un petit aimant) qui se trouve en bas à gauche (en face de la règle des pistes), est partagé par tous éléments de piste et/ou traitements placés sur le sonagramme. Il vous permet d’activer le magnétisme (ou de le désactiver, par défaut, il l’est) et d’en déterminer le type désiré pour l’ensemble des pistes. 123 21 Le séquenceur Le réglage est possible en temps (avec ou sans offset) et/ou en fréquence. Si l’on déplace un ou plusieurs éléments de piste et/ou traitements placés sur le sonagramme, ils iront automatiquement se placer contre le repère le plus proche, selon les modalités définies. Horizontalement (sur l’axe des temps), le magnétisme peut se faire par rapport : • aux marqueurs : le début ou la fin du traitement se place sur le marqueur le plus proche • aux repères de la grille (voir section 22) : le début ou la fin du traitement se place sur le repère le plus proche • aux traitements ("Glue To traitement"), le traitement se colle au traitement le plus proche Verticalement (sur l’axe fréquentiel), le magnétisme se fait par rapport au repère fréquentiel de la grille (voir section 22) le plus proche en dessous ou le plus proche au dessus ou centré entre les deux. Ce magnétisme ne s’applique qu’aux surfaces en les manipulant sur le sonagramme. Note : Le magnétisme l’emporte sur le blocage temporaire de position lors d’un changement de piste. Dans le menu "Edit", les items "Expand To Markers" (raccourci clavier "X") et "Expand To Grid" (raccourci clavier "shift+X") étendent les traitements sélectionnés respectivement aux marqueurs extérieurs les plus proches ou aux graduations temporelles de la grille les plus proches. Les informations de pistes sont sauvegardées dans le fichier de traitement. 124 22 La grille : "Grid" Il est possible d’afficher une grille repère sur le séquenceur et sur le sonagramme. Dans le menu "Window", choisissez l’item "Show Grid Settings. . . " et la palette suivante s’affiche : La touche "tabulation" permet de masquer ou de montrer tour à tour cette palette ainsi que celles des trois autres ("Palette d’outils ("Tools")", "Sonogram Display", "Inspector") qui sont cochées. En cochant la case "Time Grid", vous affichez les repères temporels que vous paramétrez en choisissant le pas (en secondes, en BPM ou en échantillons ("Samples")) et un éventuel "Offset" (en secondes, en BPM ou en échantillons ("Samples")). Cet "Offset" permet de caler la grille ailleurs que sur le zéro temporel (à une attaque, par exemple). En cochant la case "Frequency Grid", vous affichez les repères fréquentiels que vous paramétrez en choisissant d’abord le mode (linéaire ou logarithmique), le pas (en Hz) et l’"Offset" 125 22 La grille : "Grid" (en Hz). • en mode linéaire, pas et "Offset" sont en Hz, • en mode logarithmique ("Harmonic"), le pas est en "Cents" ou en intervalle et l’"Offset" devient la fréquence de base ("Base Frequency") en Hz. Le magnétisme de la grille s’active dans le séquenceur (voir la section 21.2). 126 23 Les autres traitements Les traitements suivants sont accessibles dans le menu "Processing". Note : Ces traitements ne s’inscrivent pas sur les pistes du séquenceur et ne peuvent être sauvegardés. Le calcul se fait donc individuellement et directement pour chacun d’eux. 23.1 "Source Filter Synthesis" : synthèse croisée par source/filtre Typiquement, la synthèse croisée par source/filtre consiste à multiplier le spectre FFT du premier son par l’enveloppe spectrale résultant de l’analyse LPC du second son. Le premier son est donc filtré par l’enveloppe spectrale du second. En fait, pour le son filtrant (second son), vous avez le choix entre plusieurs types d’analyse : • par défaut : LPC • FFT (en fait, synthèse croisée généralisée, voir plus bas) • "Discrete Cepstrum" : Cepstre discret • "Inverse LPC" : LPC inverse • "Inverse Discrete Cepstrum" : Cepstre discret inverse 127 23 Les autres traitements Vous disposez ensuite des options suivantes "Source Filter Type" : • Amplitude+Phase • Amplitude • Phase Vous choisirez ces options dans la palette "Source Filter Synthesis", ouverte par l’item "Source Filter Synthesis. . . " du menu "Processing". Note : Il faut noter que pour le Cepstre discret ("Discrete Cepstrum") et le Cepstre discret inverse ("Inverse Discrete Cepstrum") la phase est nulle, seule l’amplitude est prise en compte. Le son ouvert (ou en premier plan) est le son filtré. Cette palette rappelle le nom du son filtré ("Filtered Sound") et vous invite à choisir le son filtrant ("Filtering Sound") en cliquant sur le bouton "Select". La fenêtre de dialogue standard s’ouvre, permettant de naviguer dans l’arborescence des disques durs et d’y choisir le son filtrant. 128 23 Les autres traitements Une fois choisi le son filtrant, vous réglez les paramètres d’analyse habituels pour chacun des deux canaux ("Analysis Settings") : "Window Size", "Window Step", "Window Type" ainsi que le nombre de pôles dans l’analyse LPC ou Cepstre discret ("Analysis Order"). Plus il y a de pôles, plus l’enveloppe spectrale est détaillée. On peut vouloir n’utiliser que peu de pôles pour ne modéliser que les formes les plus importants de l’enveloppe spectrale. Les paramètres de synthèse ("Synthesis Settings") : le type de synthèse ("Source Filter Type" ), la taille de la FFT ("FFT Size") et le type de fenêtre pour la resynthèse ("Window Type"). Pour plus de détails, reportez vous à la section 25.1. Le gain réglable est destiné au mode temps réel. Note : La sortie est normalisée par défaut. Par défaut, la case "Verbose Output" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). Après avoir défini vos paramètres, vous validez par "OK". La palette de réglage se referme et une fenêtre de dialogue standard s’ouvre, vous demandant sous quel nom et à quel endroit vous désirez enregistrer le résultat (par défaut dans le dossier "Sounds"). Le choix fait, vous validez par "OK". Cette fenêtre se referme et le calcul se lance. Une fois le calcul terminé, une nouvelle fenêtre AudioSculpt s’ouvre montrant le résultat (cette fenêtre porte le nom du nouveau son). Note : Le son filtrant prend la taille du son filtré. Voici le résultat du son "noise1.aiff" par le son "Cymbal.AIFF" avec analyse LPC : 129 23 Les autres traitements Son "noise.aiff" par le son "Cymbal.AIFF" avec analyse LPC inverse : 23.2 "Generalized Cross Synthesis" : synthèse croisée généralisée Il s’agit là de multiplier les analyses FFT de deux sons (donc amplitude et phase). Le son ouvert (ou en premier plan) est le son 1. Dans le menu "Processing", faites "Generalized Cross Synthesis". La palette suivante s’ouvre, rappelant le nom du son 1 ("Sound 1"), et vous invite à choisir le son 2 ("Sound 2" en cliquant sur le bouton "Select"). La fenêtre de dialogue standard s’ouvre, permettant de naviguer dans l’arborescence des disques durs et d’y choisir un son. 130 23 Les autres traitements Vous avez le choix entre deux modes : • "Cross" : synthèse croisée (analogue au traitement précédent) ; il faut régler les coefficients d’amplitude ("Amplitude Scaling") et de phase ("Phase Scaling") pour chacun des sons ainsi que le coefficient du produit des amplitudes "Q Factor". • "Add" : addition des sons (mixage) ; dans ce cas, seul le paramètre "Amplitude Scaling" du son 1 est à définir (il permet de faire varier les proportions des deux amplitudes). Vous réglez les paramètres habituels d’analyse ("FFT Settings") et de resynthèse ("Synthesis Settings"). Reportez vous à la section 25.1. Note : La sortie est normalisée par défaut. Par défaut, la case "Verbose Output" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). Après avoir défini vos paramètres, vous validez par "OK". La palette se referme et une fenêtre de dialogue standard s’ouvre, demandant sous quel nom et à quel endroit vous désirez enregistrer le résultat (par défaut dans le dossier "Sounds"). Le choix fait, vous validez par "OK". Cette fenêtre se referme et le calcul se lance. Une fois le calcul terminé, une nouvelle fenêtre AudioSculpt s’ouvre montrant le résultat (cette fenêtre porte le nom du nouveau son). Note : Le son résultant a la taille du son le plus long. 23.3 Normalisation La normalisation s’applique à la totalité du son. La fonction "Normalize. . . " trouve dans le menu "Processing" et ouvre une boîte de dialogue qui permet de régler (en dB) la marge 131 23 Les autres traitements restant après normalisation. Après avoir défini votre paramètre, vous validez par "OK". La fenêtre se referme et une fenêtre de dialogue standard s’ouvre demandant sous quel nom et à quel endroit vous désirez enregistrer le résultat (par défaut dans le dossier "Sounds"). Le choix fait, vous validez par "OK". Cette fenêtre se referme et le calcul se lance. Une fois le calcul terminé, une nouvelle fenêtre AudioSculpt s’ouvre montrant le résultat (cette fenêtre porte le nom du nouveau son). La normalisation peut se faire "In-place" en cochant la case adéquate. Important : dans ce cas, elle s’applique au son original, donc le modifie, et ne peut être annulée. 23.4 Samplerate Conversion Dans le menu "Processing", l’item "Samplerate Conversion. . . " ouvre une boîte de dialogue permettant de convertir, non seulement le taux d’échantillonage ("Samplerate"), mais aussi de changer la résolution de la quantification ("Samplesize") et le type de fichier. Le filtre "Anti-Aliasing" est réglable. Il permet d’éviter les phénomènes de distorsion dus au 132 23 Les autres traitements repliement. C’est un filtre passe-bas d’ordre élevé. Plus l’atténuation des hautes fréquences est grande, moins il y a de distorsion, mais plus le coût du calcul est élevé. La valeur par défaut (70 dB) correspond à l’atténuation minimale des fréquences repliées. Cette conversion ne faisant pas appel à l’habituel panneau de réglage, il vous est proposé : • une normalisation réglable • l’option "verbose". Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne de commande, s’afficheront dans la fenêtre de la console SuperVP. Après avoir défini vos paramètres, vous validez par "OK". La fenêtre se referme et une fenêtre de dialogue standard s’ouvre demandant sous quel nom et à quel endroit vous désirez enregistrer le résultat (par défaut dans le dossier "Sounds"). Le choix fait, vous validez par "OK". Cette fenêtre se referme et le calcul se lance. Une fois le calcul terminé, une nouvelle fenêtre AudioSculpt s’ouvre montrant le résultat (cette fenêtre porte le nom du nouveau son). 133 23 Les autres traitements 134 24 Les consoles Il faut distinguer deux types de consoles : 24.1 La console intégrée La console attachée à la fenêtre AudioSculpt (zone 5, en bas de la fenêtre) est propre au son ouvert. Reportez vous à la section 5.2. Elle est repliée au départ et indique "Ready" : c’est la console SuperVP, où s’inscrivent les lignes de commande et éventuellement des alertes générées par SuperVP ou pm2. Pour la déplier, il faut cliquer sur le triangle se trouvant au-dessus. Si l’option "Verbose Output" ou "Verbose", selon le cas, (pour les utilisateurs avertis : flag -v) est cochée dans les panneaux de commande, cette console affichera des informations détaillées données par SuperVP ou pm2. Cette console peut être sauvegardée grâce à l’item "Save Console As. . . " qui se trouve en bas du menu "File". 135 24 Les consoles 24.2 La console vide : "New Console" La console obtenue par "New Console" dans le menu "File". Cette nouvelle console permet de lancer des lignes de commande. La sauvegarde de cette console (lorsque celle-ci est active) se fait dans le menu "File" directement par "Save Console" ou "Save Console as. . . ". En effet, ces items n’apparaissent dans ce menu, à cet endroit, que dans ce cas de figure : console active. 136 24 Les consoles Ces consoles sont enregistrées au format texte et peuvent être ouvertes dans n’importe quel éditeur de texte. "Print" du menu "File" permet d’imprimer l’une ou l’autre console active. 137 24 Les consoles 138 25 Calcul des traitements : "Processing" 25.1 Calcul sur la totalité du son : "Process Treatments ..." Pour lancer le calcul des traitements, choisissez "Process Treatments. . . " dans le menu "Processing". Cette commande reste grisée tant qu’un traitement au moins n’a pas été défini. Le calcul prend en compte tous les traitements définis dans le séquenceur, hormis ceux disposés sur les pistes désactivées par le bouton "mute" (voir section 21.2). Astuce : La fonction "mute" l’emporte sur la fonction "solo". Une boîte de dialogue s’ouvre pour vous permettre de choisir vos paramètres : 25.1.1 Paramètres de l’analyse : "FFT Settings" • "Window Size" (Taille de la fenêtre) : la taille de la fenêtre est le nombre d’échantillons du son dans chaque analyse. La taille de la fenêtre est le paramètre essentiel de l’analyse : il détermine les résolutions fréquentielle et temporelle. Les champs "Window Size" et "Fundamental Frequency" sont interdépendants. • "Fundamental Frequency" (Fréquence fondamentale) en Hz : permet d’ajuster la résolution fréquentielle directement. Pour un son monophonique, c’est sa fréquence fonda- 139 25 Calcul des traitements : "Processing" mentale. Taille de la fenêtre, pas d’avancement et taille de la FFT sont adaptés en conséquence. La taille de la fenêtre est programmée à 5 fois la longueur de la période qui correspond à la fréquence fondamentale indiquée. • "Window Step" (Pas d’avancement) : détermine l’intervalle de temps, mesuré en nombre d’échantillons, entre 2 analyses successives. En mode automatique, SuperVP ajuste automatiquement le pas d’avancement pour un résultat optimal (et le rend même variable, si nécessaire) en fonction des traitements définis. Il est recommandé d’utiliser ce mode. En manuel, vous précisez vous-même le pas d’avancement (pour les utilisateurs avertis : flag -I). Important : le mode automatique fonctionne différemment pour les analyses (voir section 16.1). • "FFT Size" (Taille de la FFT) : détermine le nombre de points de l’analyse appliquée aux échantillons ; il est obligatoirement égal ou supérieur à la taille de la fenêtre. • "Analysis Window" (Fenêtre d’analyse) : permet de spécifier le type de fenêtre utilisé dans l’analyse. Trois types de fenêtre sont proposés : Blackman, Hanning et Hamming. 25.1.2 Paramètres de la synthèse : "Synthesis Settings" • "Phase Synchronous Processing" (Synchronisation des phases) : permet le processus de synchronisation des phases (pour les utilisateurs avertis : flag -P) ; en général, ce processus améliore le résultat. Ne décochez la case "Phase Synchronous Processing" que si vous savez ce que vous faites. • "Preserve Transients" (Préservation des transitoires) : cette option n’est active que si la case "Phase Synchronous Processing" est cochée (voir ci-dessus). • "Analysis Window" (Fenêtre d’analyse) : permet de spécifier le type de fenêtre utilisé dans l’analyse. Trois types de fenêtre sont proposés : Blackman, Hanning et Hamming. • "Filter Superposition Mode" (Mode de superposition des filtres) : propose le choix entre les modes "Multiply" et "Maximum" pour le chevauchement des traitements qui modifient le gain (filtres surfaces et filtres formantiques). • mode "Multiply" : les gains en dB s’additionnent, • mode "Maximum" : le gain le plus grand est pris comme gain maximal. • "Envelope Preservation Order" : définit le nombre de pôles du filtre si la préservation de l’enveloppe spectrale a été demandée dans une transposition. • "Normalize Output" : Par défaut, la normalisation en sortie de traitement n’est pas activée. Il vous faudra donc faire attention lorsque vous appliquez des traitements qui augmentent le gain. • "Transient Preservation Settings" : permet le réglage nécessaire à la préservation des transitoires (voir section 27). Par défaut, la case "Verbose Output" n’est pas cochée. Si vous cochez cette option (pour les utilisateurs avertis : flag -v), toutes les informations données par SuperVP, outre la ligne 140 25 Calcul des traitements : "Processing" de commande, s’afficheront dans la fenêtre de la console SuperVP. Elles seront visibles, si celle-ci est dépliée (voir section 24.1). Cliquez sur "Process". AudioSculpt vous demande sous quel nom (ici "africa.aiff.out" par défaut) et à quel endroit vous désirez enregistrer le résultat (le dossier "Sounds" situé dans le dossier de l’application par défaut). Après avoir cliqué sur OK, le calcul se lance. La barre de progression, située en bas de la fenêtre AudioSculpt, permet d’en suivre l’avancement. Celui-ci terminé, ne nouvelle fenêtre AudioSculpt s’ouvre dans laquelle le son traité s’affiche. Note : Si vous effectuez plusieurs traitements de suite sur le même son, AudioSculpt vous proposera une incrémentation automatique du nom du nouveau son. 25.2 Calcul sur une partie du son : "Process Selection. . . " Il est possible de ne calculer qu’une partie du son avec les traitements correspondants. Après avoir sélectionné la région voulue, choisissez "Process Selection. . . " dans le menu "Processing". Cette commande reste grisée tant qu’une partie du son n’a pas été sélectionnée. 25.3 Les fichiers temporaires Les fichiers générés par AudioSculpt pour SuperVP sont stockés temporairement dans le dossier "Temp". Ils sont immédiatement remplacés, si vous faites un calcul de même type et irrémédiablement détruits lorsque vous quittez AudioSculpt (Il est tout à fait inutile de les conserver, ils seront régénérés lors d’un prochain calcul, si vous sauvegardez le traitement). Par contre, pour l’utilisateur averti qui veut les observer (ce sont des fichiers textes, fort longs parfois, éditables dans BBEdit, par exemple), et qui souhaite éventuellement les modifier pour les réutiliser dans un calcul par ligne de commande, il faut les déplacer dans un autre dossier. 25.4 Session de travail Les options choisies pour les "Processing" restent valables durant toute la durée d’une session de travail (jusqu’à ce que l’on quitte AudioSculpt). Mais il est possible de les sauvegarder dans les préférences à l’aide du bouton "Save in Preferences". Le bouton "Reset Parameters" permet de revenir à ces valeurs après un changement. Le bouton "Factory Settings" restitue les valeurs par défaut du logiciel. 141 25 Calcul des traitements : "Processing" 142 26 Interruption d’un calcul Il est toujours possible d’interrompre un calcul en cliquant sur le bouton "Stop" de la console. La partie de son calculé sera dûment enregistrée et la fenêtre de ce nouveau son s’ouvrira, même si la normalisation est activée. Il en va de même pour certaines analyses. 143 26 Interruption d’un calcul 144 27 Détection et préservation des transitoires Dans le panneau de réglage ouvert par "Process Treatments. . . ", "Process Selection. . . " ou "Realtime Processing Settings. . . " (menu "Processing"), l’option "Preserve Transients" permet la détection des transitoires pour améliorer certains traitements. Cette option fonctionne avec des paramètres prédéfinis réglables dans la partie "Transient Preservation Settings". La détection des transitoires n’est possible qu’en mode "Phase Synchronous Processing" (voir section 25.1.2). Ces paramètres se retrouvent, bien sûr, dans le panneau de réglage des marqueurs par détection de transitoires ("Segmentation Type : Transient Detection"), du menu "Analysis" (item "Generate Markers. . . "). Cette détection de transitoires repose sur la concentration d’énergie dans la partie droite de la fenêtre d’analyse. Pour pouvoir faire cette détection dans des signaux polyphoniques, la localisation de l’énergie se fait dans des bandes fréquentielles. Au cours du traitement, la fenêtre d’analyse se déplace sur le signal. Lorsque le début d’un événement sonore est positionné dans la partie droite de cette fenêtre, on considère que l’on est dans la situation d’un transitoire, le cas limite étant, le début d’un événement sonore positionné au centre de la fenêtre. L’évaluation de la localisation de l’énergie est faite de façon normalisée de manière à ce que les valeurs soient comprises entre 1 et 10. Dans le cas idéal, c’est-à-dire en l’absence de tout bruit ou son résiduel, un transitoire produit une évolution de la localisation de l’énergie qui commence à 10 (c’est à dire à l’extrême droite de la fenêtre) et diminue jusqu’à 1 (cas limite : centre de la fenêtre). En réalité, le bruit existant diminue la valeur maximale de la localisation normalisée de l’énergie. Plus l’amplitude du début d’un événement sonore sera élevée par rapport au bruit, plus la valeur maximale de la localisation normalisée de l’énergie s’approchera de 10. Ce ne sont pas seulement les transitoires qui peuvent créer un déplacement d’énergie, mais aussi des signaux bruités. Pour distinguer ces deux cas, un modèle statistique est utilisé. • "Threshold (larger than 1)(1-10) " : seuil de la localisation normalisée de l’énergie au dessus duquel un transitoire pourra éventuellement être détectée. Par défaut, la valeur de ce seuil est 1.4. Pour la valeur 10, rien n’est détecté. Pour la valeur 1, il est très probable que des transitoires soient détectés, alors que ce ne sont que des variations du bruit résiduel. Ce seuil peut être réduit, pour augmenter la sensibilité de la détection et inversement. • "Detection Frequency Range (between 0 and nyquist)" en Hz : détermine les limites fréquentielles (minimale : 0Hz et maximale : nyquist, fréquence d’échantillonnage divisée par 2) pour les bandes utilisées par l’évaluation de la localisation normalisée de l’énergie 145 27 Détection et préservation des transitoires et pour la détection. Cette valeur peut être modifiée, mais pour le traitement, la totalité de la bande du signal est utilisée. 146 • "Confidence (0.5-4)" : seuil du degré de confiance, déduit du modèle statistique, requis pour un transitoire. Par défaut, la valeur est 2.5. Ce seuil peut être diminué, pour augmenter la sensibilité de la détection et inversement. • "Single Sinusoid Impact Factor" : coefficient en pourcentage qui définit la taille des bandes fréquentielles par rapport à une sinusoïde stationnaire. Pour chaque bande, la localisation de l’énergie est évaluée indépendamment. Il est vivement recommandé de ne pas le modifier, sauf à savoir vraiment ce que l’on fait. Par défaut, sa valeur est 10 %. • "Transient Amplitude compensation factor" : facteur de compensation de l’amplitude d’un transitoire. La valeur 1.4 compense la perte d’amplitude due à l’algorithme de préservation des transitoires. En augmentant considérablement cette valeur (2000 par exemple) et en n’oubliant surtout pas de normaliser, seules ressortiront les transitoires. 28 Mode "Temps réel" : "Realtime mode" AudioSculpt (en fait, SuperVP) peut jouer tout ou partie d’un son avec traitements en temps réel. Cela dépend, bien sûr, de la capacité de la machine et du nombre et du type de traitements désirés. La fonction "mute" ou "solo" de chaque piste du séquenceur permet d’en désactiver certains (voir section 21.2). Cela dépend aussi du nombre de canaux. Cette fonction permet de faire rapidement des essais et de vérifier la validité de ces traitements. Pour déclencher le mode "Temps réel", il faut cliquer sur le bouton représentant un hautparleur situé à gauche du bouton "Play" (raccourci clavier : "Enter"). Pour arrêter, il suffit de recliquer sur le bouton ou de refaire "Enter". Ce même bouton se retrouve dans la boîte de dialogue qui s’ouvre avec l’item "Realtime Processing Settings. . . " du menu "Processing" (voir section 28), dans laquelle vous pouvez choisir vos paramètres. Il est ainsi possible d’écouter le résultat avec différents paramètres. Par ailleurs, dans le champ "Gain", vous pouvez donner une valeur, facteur d’amplification qui permet d’éviter la saturation en sortie, car la normalisation n’est pas utilisable en temps réel. Après cette vérification, il est nécessaire de relancer le calcul de la manière habituelle ("Process Treatments. . . " du menu "Processing", voir section 25) pour écrire le fichier sur le disque. 147 28 Mode "Temps réel" : "Realtime mode" 148 29 Sauvegarde des fichiers Il est possible de sauvegarder n’importe quel type de fichier en cours ou en fin de travail. Ceci est particulièrement utile si vous voulez conserver des fichiers utilisant des paramètres différents. Ces sauvegardes se font à partir du menu "File". Seuls apparaissent en noir les items possibles, les autres sont grisés. Certains items peuvent être grisés ou différents suivant le contexte. Le menu "File" propose : • Save Treatments (Save Console, Save Bpf) : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier de traitements courant (ou la console ouverte par "New Console", ou la Bpf). • Save Treatments As. . . (Save Console As. . . , Save Bpf As. . . ) : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier de traitements courant (ou la console ouverte par "New Console", ou la Bpf). • Save Sound As. . . : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier son courant. • Save Analysis As. . . : propose un sous-menu proposant à son tour de choisir le type d’analyse à sauvegarder puis ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier SDIF contenant une analyse. • Save Console. . . : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder la console attachée à la fenêtre AudioSculpt. Par défaut, la sauvegarde est proposée dans les dossiers prédéfinis présents dans le dossier de l’application. Il est possible de changer les destinations par défaut en définissant de nouveaux chemins d’accès dans le panneau "Environment" des "Preferences". Pour le son "Mon_Son.aiff", le nom et le dossier par défaut sont : • Traitements : "Mon_Son.trt" dans le dossier "Treatments" • Sonagramme (Fft, LPC, Cepstre Discret) ; "Mon_Son.aiff.fft.sdif" dans le dossier "Fft" • Marqueurs : "Mon_Son.aiff.mrk.sdif" dans le dossier "Markers", • Fréquence fondamentale : "Mon_Son.aiff.f0.sdif" dans le dossier "Fundamental" • Suivi de partiels : "Mon_Son.aiff.trc.sdif" dans le dossier "Fundamental" • Séquence d’accord : "Mon_Son.aiff.mrk.sdif" dans le dossier "Fundamental" • Détection des pics : "Mon_Son.peak.txt" dans le dossier "Fundamental" • Masking Effects : "Mon_Son.mask.txt" dans le dossier "SpectralEstimates" • Son traité : "Mon_Son.out.aiff" puis Mon_Son.out 1.aiff" . . . dans le dossier "Sounds" Si vous n’avez fait aucune sauvegarde, à la fermeture du son une boîte de dialogue vous invite à sauvegarder ce que vous souhaitez (les items utiles sont cochés et il suffit de décocher celui ou ceux que vous ne voulez pas conserver). 149 29 Sauvegarde des fichiers Note : s’il n’y a qu’un élément à sauvegarder, seule la boîte de dialogue standard s’ouvre. Les traitements peuvent être aussi sauvegardés par "glisser-déposer" ("Drag and Drop") sur le bureau (voir section 19.5.13). 150 30 Format des fichiers 30.1 Les différents formats Les sons traités sont enregistrés sous leur format de départ (AIFF, SDII ou WAV) avec un taux d’échantillonnage et une résolution de la quantification identiques. Les traitements sont sauvegardés au format SDIF. Les traitements sauvegardés par "glisser-déposer" ("Drag and Drop") sont des extraits au format texte du fichier SDIF lisibles directement et non modifiables. Les fichiers temporaires (paramètres des traitements) sont des fichiers textes, fort longs parfois, éditables et modifiables dans un éditeurs de texte. Les consoles sont au format texte. Il est donc aisé d’y récupérer des lignes de commande et de les utiliser dans une console SuperVP. Les Bpf sont sauvegardés sous forme de documents directement exploitables par AudioSculpt (elles peuvent être éditées et modifiées dans l’éditeur de Bpf). Ce sont des fichiers textes, fort longs parfois, éditables et modifiables dans un éditeurs de texte. Note : Cela ne concerne pas les Bpf générées par analyse. Les analyses sont sauvegardées au format SDIF ou texte, selon le cas : • Les fichiers "Sonogram Analysis", "Fundamental Analysis", "Partial Tracking Analysis" et "Chord Sequence Analysis" sont au format SDIF. • Les fichiers "Peak Detection" et "Masking Effects" sont au format texte. 30.2 Les fichiers SDIF Le format SDIF (Sound Description Interchange Format) est un standard de format de fichiers de paramètres d’analyse et de synthèse, format de description des sons. Pour plus de détails, veuillez vous reporter au site : http://www.ircam.fr/sdif De tels fichiers peuvent être importés et utilisés dans d’autres logiciels ("Open Music", par exemple). Dans AudioSculpt, ces fichiers portent (par défaut) tous une double extension (par exemple : "Mon_Son.fft.sdif", "Mon_Son.f0.sdif" ou "Mon_Son.mrk.sdif". . . ). Il est indispensable de conserver l’extension ".sdif" et conseillé de conserver l’autre pour différencier les fichiers. Vous pouvez, bien sûr l’appeler "Mon_Sonfft.sdif" ou "Mon_Son_Sonogram.sdif" ou "Mon_Son_JolieImage.sdif". Un fichier au format SDIF peut être converti en texte (et inversement) au moyen de Droplets. Cela permet donc de les modifier. Le dossier "Droplets" contenant ces Droplets (et les kernels correspondants) est placé dans le dossier d’AudioSculpt. Il suffit de glisser un fichier SDIF sur l’application "sdiftotext" et d’attendre la fin de la conversion (une barre de progression vous informe). 151 30 Format des fichiers Le fichier "Mon_Son.aiff.fft.sdif" devient "Mon_Son.aiff.fft.sdif.txt". Après modification, vous opérez la manipulation inverse en glissant le fichier texte sur l’application "texttosdif". Le fichier devient : "Mon_Son.aiff.fft.sdif.txt.sdif". Il est donc recommandé de simplifier son nom à ce moment-là. 152 31 Les menus 31.1 Menu "File" Certains items peuvent être grisés ou différents suivant le contexte. • New Console : ouvre une nouvelle console SuperVP, indépendante des sons ouverts. Cela permet de lancer une suite de calculs par lignes de commande. • New Bpf. . . : ouvre une nouvelle fenêtre de l’éditeur de Bpf. • New Track : ajoute une nouvelle piste dans le séquenceur de traitements. • Open. . . : ouvre une boîte de dialogue standard permettant de choisir un son et de l’ouvrir. • Open Recent : propose un sous-menu qui permet de choisir un son parmi ceux qui ont été ouverts précédemment. • Open Analysis. . . : ouvre une boîte de dialogue standard permettant de choisir un fichier d’analyse et de l’ouvrir ainsi que le son qui lui est associé. • Open Treatment. . . : ouvre une boîte de dialogue standard permettant de choisir un fichier de traitement. • Open Analysis. . . : propose un sous-menu proposant à son tour de choisir le type d’analyse souhaitée puis l’ouverture de la boîte de dialogue standard permettant de choisir un fichier d’analyse (voir figure suivante). 153 31 Les menus 154 • Open Bpf. . . : ouvre une boîte de dialogue standard permettant de choisir une Bpf précédemment sauvegardée. • Close : ferme la fenêtre courante. • Save Treatments (Save Console, Save Bpf) : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier de traitements courant (ou la console ouverte par "New Console", ou la Bpf). • Save Treatments As. . . (Save Console As. . . , Save Bpf As. . . ) : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier de traitements courant (ou la console ouverte par "New Console", ou la Bpf). • Save Sound As. . . : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier son courant. • Save Analysis As. . . : propose un sous-menu proposant à son tour de choisir le type d’analyse à sauvegarder puis ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder le fichier SDIF contenant une analyse (voir figure 31.1C). • Save Console. . . : ouvre une boîte de dialogue standard permettant de choisir le nom et l’endroit où sauvegarder la console de la fenêtre AudioSculpt. • Page Setup. . . : inutile pour la fenêtre AudioSculpt ; "format d’impression. . . " pour console (ouverte par "New Console") ou pour Bpf. • Print. . . : inactif pour la fenêtre AudioSculpt ; "imprimer. . . " pour console (ouverte par "New Console") ou pour Bpf. • Export Image. . . : permet d’exporter, au choix, l’image de la forme d’onde de la totalité du son, ou du sonagramme (ou des deux) au format PNG, TIFF, JPEG ou PICT (actif seulement pour la fenêtre AudioSculpt). 31 Les menus 31.2 Menu "Edit" Certains items peuvent être grisés ou modifiés selon le contexte. • Undo : annule la dernière de certaines actions (celle-ci est décrite). • Redo : refait la dernière action annulée (celle-ci est décrite). • Cut : supprime et copie dans le presse-papier (traitement, valeur, texte selon le cas). 155 31 Les menus • Copy : copie (traitement, valeur, texte selon le cas). • Paste : colle (traitement, valeur, texte selon le cas). • Clear : supprime (traitement, valeur, texte selon le cas). • Delete Selected Track: détruit la piste sélectionnée. • Add Markers : ajoute un marqueur manuel. • Add Chord Seq Marker : ajoute une paire de marqueurs pour l’analyse "Chord Sequence". • Delete Markers. . . : ouvre la boîte de dialogue "Select the Markers to delete" permettant de choisir le type de marqueurs à détruire. • Delete Selected Markers. . . : détruit les marqueurs sélectionnés. • Change Gain. . . : ouvre la boîte de dialogue "Edit Gain" qui permet de changer le gain des traitements sélectionnés (si cela est possible). • Replicate in Frequency. . . : ouvre le panneau "Replicate in Frequency" permettant de régler la duplication en fréquence des surfaces sélectionnées (si cela est possible). • Replicate in Time. . . : ouvre le panneau "Replicate in Time" permettant de régler la duplication dans le temps (positivement ou négativement) des traitements sélectionnés. • Expand To Markers : étend la durée des traitements sélectionnés aux marqueurs les plus proches (à gauche et à droite). • Expand To Grid : étend la durée des traitements sélectionnés aux repères de la grille les plus proches (à gauche et à droite). • Select All : sélectionne tout le son. • Select All Treaments : sélectionne tous les traitements. • Select by Attribute. . . : inactif. 31.3 Menu "Analysis" 156 31 Les menus • Sonogram Analysis. . . : ouvre le panneau "Analysis Parameters" pour paramétrer et lancer le calcul du sonagramme sur la totalité du son. • Sonogram of Selection. . . : ouvre le panneau "Analysis Parameters" pour paramétrer et lancer le calcul du sonagramme sur la partie sélectionnée du son. • Fundamental Analysis. . . : ouvre le panneau "Fundamental Analysis Parameters" pour paramétrer et lancer le calcul de l’analyse de la fréquence fondamentale (f0). • Partial Tracking Analysis. . . : ouvre le panneau "Partial Tracking Parameters" pour paramétrer et lancer le calcul de l’analyse des partiels. • Chord Sequence Analysis. . . : ouvre le panneau "Chord Sequence Parameters" pour paramétrer et lancer le calcul de l’analyse "Chord Sequence". • Generate Markers. . . : ouvre le panneau "Marker Parameters" pour paramétrer et lancer le calcul des marqueurs non manuels. • Peak Analysis : ouvre le panneau "Peak Detection" pour paramétrer et lancer le calcul de détection des pics. • Masking Effects : ouvre le panneau "Masking Effects" pour paramétrer et lancer le calcul des effets de masquage. 31.4 Menu "Treatments" Les traitements sont définis sur la totalité du son par défaut. Si une partie du son est sélectionnée, ils sont définis sur cette partie. • Add Constant Transposition. . . : ajoute le traitement correspondant et ouvre le panneau 157 31 Les menus de réglage "Constant Transposition" permettant de paramétrer la "Transposition". • Add Constant TimeStretch. . . : ajoute le traitement correspondant et ouvre le panneau "Constant TimeStretch" permettant de régler le coefficient de "Dilatation/compression". • Add Freeze. . . : ajoute le traitement correspondant et ouvre le panneau "Freeze" permettant de régler la durée du gel. • Add Reverse/Repeat. . . : ajoute le traitement correspondant et ouvre le panneau de réglage "Reverse/Repeat" permettant de paramétrer le traitement. • Add Constant Formant Filter. . . : ajoute le traitement correspondant et ouvre le panneau de réglage "Formant Filter" permettant de paramétrer le filtre par "Formant". • Add Band Filter. . . : ajoute le traitement correspondant et ouvre le panneau de réglage "Band Filter" permettant de paramétrer le filtre de type "Bande". • Add Clipping Filter. . . : définit un filtre "Clipping" paramétrable par l’élément de piste correspondant. • Add Image Filter. . . : ouvre une boîte de dialogue standard permettant de choisir une image à utiliser comme filtre. Pour les items suivants, l’éditeur de Bpf ouvre une fenêtre permettant d’éditer la Bpf correspondante. • Add Dynamic Transposition. . . : ajoute le traitement correspondant et ouvre une fenêtre permettant d’éditer une Bpf "Transposition". • Add Dynamic TimeStretch. . . : ajoute le traitement correspondant et ouvre une fenêtre permettant d’éditer éditer une Bpf "Dilatation-compression". • Add Breakpoint for Gain. . . : ajoute le traitement correspondant et ouvre une fenêtre permettant d’éditer une Bpf de "Gain". • Add Breakpoint Filter. . . : ajoute le traitement correspondant et ouvre une fenêtre permettant d’éditer un "Breakpoint Filter". • Add Dynamic Formant. . . : inactif. • Invert : permet "d’inverser" le ou les traitements sélectionnés (utilisable uniquement pour certains traitements, sinon l’item est grisé). • Create Tracks When Needed : en cochant cet item, une nouvelle piste n’est créée automatiquement que si nécessaire (c’est-à-dire pour qu’un traitement n’en cache pas un autre). 31.5 Menu "Processing" Certains items peuvent être grisés selon le contexte. 158 31 Les menus • Process Treatments... : ouvre le panneau "Processing Parameters" pour le calcul des traitements sur la totalité du son (grisé tant qu’un traitement n’est pas défini). • Process Selection. . . : ouvre le panneau "Processing Parameters" pour le calcul des traitements sur la portion de son sélectionnée (grisé tant qu’un traitement n’est pas défini et qu’une portion du son n’est pas sélectionnée). • Realtime Porcessing Settings. . . : ouvre le panneau de réglage "Realtime Processing Parameters" pour le mode temps réel. • Source Filter Synthesis. . . : ouvre le panneau "Source Filter Synthesis" permettant de régler la synthèse croisée de type source/filtre. • Generalized Cross-Synthesis. . . : ouvre le panneau "Generalized Cross-Synthesis" permettant de régler la synthèse croisée généralisée. • Normalize. . . : ouvre le panneau "Normalize" permettant de régler le paramètre pour le calcul de ce traitement sur la totalité du son. • Samplerate Conversion. . . : ouvre le panneau "Samplerate Conversion" permettant de régler les paramètres pour le calcul de ce traitement sur la totalité du son. • Convert to Surface : inactif. 31.6 Menu "Window" 159 31 Les menus • Show Tools : affiche la palette flottante des outils "Tools" (si l’item est coché). • Show Inspector : affiche la palette flottante "Inspector" (si l’item est coché). • Show Sonogram Display : affiche la palette "Sonogram Display" permettant : • • de montrer ou de cacher les éléments de la zone 3 (sonagramme) • de régler la profondeur des niveaux de gris du sonagramme, c’est-à-dire la sensibilité du noir et du blanc • de régler le seuil d’affichage des marqueurs Show Grid Settings : affiche la palette de réglage "Grid Settings" de la grille. Note : Lors de la prochaine session d’AudioSculpt, les palettes dont l’item est coché, seront automatiquement ouvertes. La touche "tabulation" permet de masquer ou de montrer tour à tour ces palettes ("Tools", "Inspector", "Sonogram Display" et "Grid Settings"). • Maximize Sonogram : permet d’afficher plein écran le sonagramme et la "fenêtre dans le son" (zones 2 et 3), et de revenir à la taille initiale. Le raccourci clavier correspondant est : "Pomme+U" ("commande+U"). • Follow Playback : permet le défilement de "la fenêtre dans le son" pour suivre le déplacement du curseur. En-dessous, vous trouvez la liste des fenêtres ouvertes. Elle vous permet d’amener au premier plan celle que vous souhaitez. Les raccoucis-clavier vous permettent d’agir rapidement. 31.7 Menu "Bpf" Ce menu n’apparaît que lorsqu’une fenêtre de l’éditeur de Bpf est ouverte. 160 31 Les menus • Show Bpf Tools : ouvre la fenêtre à onglets des "Bpf Tools" (accessible aussi directement à partir de la fenêtre de la Bpf). • Show Points : permet d’afficher les points d’une Bpf. • Show Double Line : si cet item est coché, la Bpf est affichée avec une ligne plus épaisse. • Resampling. . . : permet de changer l’échantillonnage de la Bpf. Les autres items du menu sont grisés et ne concernent pas AudioSculpt. 161 31 Les menus 162 32 Les lignes de commandes Pour les utilisateurs avertis, il est possible de lancer des traitements directement en ligne de commande pour SuperVP depuis AudioSculpt. Le principe en est simple, il suffit de taper (ou de coller, ou de glisser-déposer) une telle ligne dans la console courante et de valider par la touche "Enter" : le calcul se lance. Une nouvelle console est obtenue par "New Console" dans le menu "File". Vous pouvez utiliser des fichiers de paramètres (en particulier, ceux générés par AudioSculpt voir section 25.3). La ligne de commande s’écrit sur une seule ligne, sans retour chariot. Il est possible de taper plusieurs lignes de commande, elles s’effectueront l’une après l’autre. Note : Ce type de calcul fait directement appel à SuperVP, les sons ne s’ouvriront donc pas automatiquement (ils sont stockés à l’endroit que vous aurez défini). Dans le cas d’une série de traitements, n’oubliez pas de donner des noms différents aux fichiers de sortie, car ils ne sont pas renommés automatiquement. La console peut vous donner de précieux renseignements sur d’éventuelles remarques ou erreurs renvoyées par SuperVP. AudioSculpt en affiche l’essentiel la plupart du temps. Vous trouverez les fichiers d’aide SuperVP "Aide SuperVP - svphelp" et "Filter module description" en annexe (section 33) ainsi qu’en fichiers joints au format texte. La console gérée par Audiosculpt ne permet pas de les afficher en entier. Il est aussi possible de lancer SuperVP par le "Terminal". Dans ce cas, il est préférable d’utiliser la version fournie sur le CD-Rom sous forme d’image disque (SuperVP.dmg). 163 32 Les lignes de commandes 164 33 Annexes 33.1 SuperVP -ha =================================================== SuperVP (IRCAM) 1990-2005 version : 2.59j fix-1 (compiled by niels for AudioSculpt on Wed Jan 26 17:45:54 GMT 2005) Prec=double =================================================== helpoptions:: ============== -h -ha -hi -hp -hf -ho :prints out this help description. :prints out all sections of the help besides the extended filter description. :prints out the help message for input options. :prints out the help message for processing options. :prints out the description of the different filtering modules. :prints out the help message for output options. Generally, SuperVP has two input tracks, if applicable on both tracks the options for track 1 are in upper case, for track 2 in lower case. Option flags specified in <> are mandatory. If option flags are specified in [] they may be omitted resulting in a default value. Parameter files: The parameter files that are not referenced by means of a complete path name (either starting with "/", "./", or "../") will be prefixed by the directory stored in the environment variable SVPPARAMS! If SVPPARAMS is not set the current directory is used. ---------------------------------------------------------Input options :: ================ -Ss<filename> : specifies input file name (Def: stdin) which is relative to $SFDIR if no full path is given filename can be either a soundfile or a data file (see output options -Og3 or -Og5 format) generated by an earlier call to SuperVP. To specify that a data file is used the corresponding track should be switched to data input mode with the -isdata flag. Supported sound files comprise AIFF/AIFC/WAV/NEXT/SDII with all variations of sample size and with u-law/a-law 165 33 Annexes compression. ------ Example: -Sflute Specifies input data to be read from $SFDIR/flute! ----------------------------------------------------------isdata <track>: File specified for given track (S for first track, s for second track) contains spectral data in g3 or g5 format (see input options -S and output options -Og3 or -Og5 format) ------ Example: -Sflute.g3 -isdata S Specifies input data to be read from $SFDIR/flute.g3 is in gabarit format ----------------------------------------------------------Bb<start> : specifies start position (Def: 0.0) in the input file. The starting point may be negative which will add silence in the beginning of the sound. If start contains a decimal point it is interpreted as time in seconds if not it specifies time in sample number! The first sample is at position 0; ------ Examples: -B1.4 starts processing 1.4s after the first sample -B44100 starts processing at sample position 44100 ----------------------------------------------------------Cc[k]<channel> : specifies the channel to process (Def. all channels or 1). Channel numbers start from 1. The default value depends on the selected output format. For sounds the default is to process all channels, for analysis data only one channel can be processed and the default channel is channel 1. The modifier k is only supported for the first track ’-C’ and is used for multi channel files to keep the channels not selected for processing unchanged in the output file. ------ Examples: -C2 selects the second channel from a multi channel sound file. and creates a mono output file. -Ck1 selects the first channel from a multi channel sound file and creates a sound file with the same number of channels then the input and only the first channel processed. ----------------------------------------------------------Ee<end> : 166 specifies last selected sample in the input file (Def: end of file), if end points to samples past the end of file zeros are added to the file content. 33 Annexes If end contains a decimal point it is interpreted as time in seconds if not it specifies time in sample number! ------ Examples: -E5.0 -E88200 ----------------------------------------------------------inplace : stores results into input file. Especially useful when processing selected segments (-B/-E) in which case only part of the sound is processed and the result is put back into the input file. Normalization is not available during inplace processing. When inplace processing is used with time dilation (-D) the selection of the end of the segment should be carefully selected such that the phase shift due to time dilation will not lead to artifacts. Therefore a low amplitude region should be used. ------ Example: supervp -Sfile.aiff -inplace -Fbande-noex band.par -B1. -E2. Will apply the band filter with parameters band.par to the sound file.aiff. Only the segment from time 1 sec up to 2 sec is processed and the result is put back into the original sound. --------------------------------------------------------------------Processing options :: ===================== -Aa[analysis type (Def: fft)] [] : specifies the analysis procedure. type is: fft [order (Def: 30)] : fast Fourier transform ------ Example: -Afft if transposition with preservation of spectral envelope is performed the lpc order for the estimation of the spectral envelope is given by means of the additional parameter order. ------ Example: -Afft 25 uses lpc order 25 for the preservation of the spectral envelope. Note, that the spectral envelope will only be preserved if transposition has been specified by means of -transke. lpc [order (Def: 30)] : linear prediction analysis. order is the number of poles. The lpc filter is multiplied by the residual energy to have a proper spectral representation. See -ns/ -truelpc switches for further information on lpc normalization. ------ Example: -Alpc 50 lpc_inv [order (Def: 30)] linear prediction analysis with envelope inversion. order is the number of poles. LPC analysis with with inverted spectrum for inverse filtering (for possible application see -G option or -Fgabarit). The inverse lpc filter is multiplied by the inverse 167 33 Annexes residual energy such that it may be used to create normalized excitation signal with the -Gmul mixer. If you apply inverse lpc filtering using the same signal for both tracks you create an energy normalized excitation signal that may be used as excitation for an lpc spectral envelope obtained with a second -alpc analysis recreating the energy contour of the related second signal. See -ns/ -truelpc switches for further information on lpc normalization. ------ Example : -Alpc_inv 50 freeze [nbframes (Def: 30)] Collect frequency statistics for nbframes and then freeze the amplitudes at frame nbframe and modulate the phase of the synthesized frequencies according the frequency tables gathered so far. ------ Example : -Afreeze 42 newfreeze [parfile|parstring] freeze the sound at the given time instances for the specified duration. Multiple freeze points can be established with the newfreeze modul. Parameter string for each freeze point defines start, duration, stat_length where start specifies the start time of the freeze duration specifies the duration of the freeze stat_length specifies the duration over which frequency statistics for each frequency bin are gathered before the freeze All values are specified in seconds. The parameters may be specified on the command line as a sequence of comma separated floating pint values or in a parameter file as a sequence of white space separated floating point values. After each freeze the original sound is continued. If the last character of the parameter string is the character e then after last freeze period the sound simply decays to zero without continuing with the original sound. The frequency statistics tables can collect a maximum of 100 frames. Time ranges that extend over more frames are simply reduced to fit this limit. The frequency statistics are used to modulate the phases of the synthesized frames. More variation in frequency will result in increased phase modulation which in turn increases amplitude modulation which may reduce the synthetic impression of freezed sounds. 168 33 Annexes The example below freezes the input sound at time 0.1s for 0.4s without using the frequency statistics and at time 0.5s for 0.6s modulating phases according to the frequency variations seen over the last 0.1s The sound ends after the second freeze by simply decaying to zero within half the size of the analysis window. For the same result the freezefile would contain the same string however, replacing the commas by white spaces. The newfreeze module supports phase synchronization see -P. ------ Examples : -Anewfreeze 0.1,0.4,0.,0.5,0.6,0.1,e -Anewfreeze freezefile pic [theshold] [nnumber]: peaks detection threshold is in dB attenuation below the peak amplitude, (Def: no threshold) a peak is only taken if its maximum is at least threshold dB above the neighboring minim. number is the max. number of peaks in the output, the peaks selected are the peaks with the largest amplitude. For output they are sorted according to frequency (attention: no blank between n and value) ------ Example: -Apic 30 n20 detect 20 strongest peaks that have amplitude larger than 30db above the two neighboring minima. mask [list] [threshold] [nnumber]: Terhardt algorithm for spectral smoothing list is a list of words in: amp, freq, weight, all, (def: weight) threshold (see -Apic) number is the max. number of peaks, for mask peaks are selected according to their weight. (no blank between n and value) ------ Example: -Amask amp, weight 10 n20 ced [order] : discrete cepstrum analysis. Provides a spectral envelope. default order is (Def: 30). ------ Example: -Aced 55 f0 [fmmin,][fMmax,][FFmax,][snthreshold,][smoothorder] : pitch detection fm is followed by minimum value for pitch in Hertz (Def: 50) fM is followed by maximum value for pitch in Hertz (Def: 2500) F is followed by maximum frequency in spectrum (Def: 7500) sn is followed by noise threshold in dB (Def: 50) smooth is followed by median smoothing order (Def: 1 (no smoothing)) smoothing order is enforced (rounded up) to be uneven! There is no blank between the parameter name and its value. The output file will be in SDIF format as long as -Oa is not given ------ Examples: -Af0 "fm100, fM1000, F2500, sn60, smooth3" -Af0 fm10,sn25 formant_lpc [nnumber] [lpc order] : formant detection from a spectral envelope computed via lpc. In this analysis a formant is understood to be a peak of the spectral envelope calculated using the lpc analysis module. number is the max. number of formants to detect (Def: 5) 169 33 Annexes (ordered according to increasing frequency) (no blank between n and value) order is the lpc order (Def: 15). ------ Example: -Aformat_lpc n3 10 formant_ced [nnumber] [ced order] : formant detection from a spectral envelope computed with discrete cepstrum. In this analysis a formant is understood to be a peak of the spectral envelope calculated using the ced analysis module. number is the max number of formants to detect (Def: 5) (ordered according to increasing frequency) (no blank between n and value) order is the ced order (Def: 45). ------ Example: -Aformant_ced n16 55 ced_inv [order] discrete cepstrum analysis with envelope inversion. Use it like CED analysis but only for inverse filtering (see -G option). Order is the ced order (Def: 30). ------ Example : -Aced_inv 50 Please read -O section for the formatting of the output data. ----------------------------------------------------------avseg <file or pair of time values> : computes averaged spectra for the time segments specified. If a file name is given this file should contain pairs of start - and end times of the segments. The segments can also given as a comma separated list of times directly on the command line. If only a single number is given single segment is formed that starts at the time given and continues until the end of the sound. The segment positions need to be in increasing time order and cannot overlap. You need to select the output options -OM1 or -OM2 to obtain the spectral averaged output. See -OM for further information on the output format. ------ Example: -avseg 1.0,1.1 -OM1 adds an segment lying between 1.0s and 1.1s to the list of segments. and stores the averaged spectrum in the output file. ----------------------------------------------------------D[coefficient (Def.: 1)] or -D<filename> : constant or time-varying time-stretching Apply time dilation to input sound. --- Examples: -D2.0 -D0.5 (dilation of 2, duration is doubled) (compression, duration will be divided by 2) parameter files are used for time varying operations. The files contain multiple lines indicating: 170 33 Annexes time dilate_coefficient The entries are linearly interpolated to derive the time dependent dilation. The dilation coefficient before the first and after the last file entry is extrapolated keeping its value constant. The -D flag may be given more than once in which case the result is a multiplication of the requested individual values. Time varying dilation and transposition may be applied in a single SuperVP call in which case the requested dilation is and the time compensation for the transposition are added. The optimal analysis step size is calculated automatically if no -I option is specified. This is recommended especially for time-varying dilation/transposition. You may use the -P switch for phase synchronized processing. ----------------------------------------------------------Ff<filtertype> <filename> specifies filter filtertype is one of bande gabarit breakpt surface fof fifof clip denois fshift filename is a file containing filter parameters. Multiple filters can be applied during one call to SuperVP. use option "-hf" for a description of available filters and the related parameter file format. ------ Example: -Fbande file ----------------------------------------------------------Ff<superposition mode> If multiple filters of the types bande, gabarit, breakpt, surface, fof, fifof are applied the standard behavior superimposes the filters by means of multiplying the transfer functions. This behavior is explicitely selected by specifying -FCombineMul. The alternative is -FCombineMax which will only apply the filter with maximum amplitude. The Mode of Superposition may be selected independently for the two tracks 171 33 Annexes ------ Example: -FCombineMax -fCombineMul ----------------------------------------------------------G<cross-synthesis type> [filename] or <cross-synthesis type> [-X<val>(Def:1.)] [-x<val>(Def:1.)] [-Y<val>(Def:1.)] [-y<val>(Def:1.)] [-q<val>(Def:1.)] Combine the two different tracks into a single track. Suppose S1 S2 are the short time FT spectra of the two input channels and SO is the resulting spectrum of the cross-synthesis and X/x/Y/y/qval is the value specified with flag -X/x/Y/y/q then the mixer operation is for cross type add: transform input spectra into representation using real/imaginary part and calculate SO = Xval * S1 + xval * S2, cross type cross: S1 and S2 are calculated in amplitude/freq representation and the output is Amp(SO) = Xval*Amp(S1) + xval*Amp(S2) +qval*Amp(S1)*Amp(S2) Fre(SO) = Yval*Fre(S1) + yval*Fre(S2), cross type mul: (source-filter), S1 and S2 are transformed into Amp/Phase representation and the output is Amp(SO) = Amp(S1)*Amp(S2) Pha(SO) = Pha(S1)+Pha(S2), cross type amul: (source-filter), S1 and S2 are transformed into Amp/Phase representation and the output is Amp(SO) = Amp(S1)*Amp(S2) Pha(SO) = Pha(S1), cross type pmul: (source-filter), S1 and S2 are transformed into Amp/Phase representation and the output is Amp(SO) = Amp(S1) Pha(SO) = Pha(S1)+Pha(S2). filename is the parameter file for add and cross modes. for cross mode the file is made of lines with: time X x Y y q for add mode the file is made of lines with: time X x Notes: Order and position of the -XxYyq flags is free. The processing is stopped in cross and add mode if both files are finished, 172 33 Annexes in mul/amul/pmul mode if either source is finished. Note that the increment step of the second track is adapted to match the duration of both sources if you do not specify the step size for the second channel with -i explicitely ------ Examples: -Gadd file -Gadd -X1.0 -x2.0 -Gcross -X0.5 -x0.5 -Y1.0 -y1.0 -q0.0 with mul mode inverse filtering to obtain a normalized excitation can be performed with the same sound on both channels. ------ Example : supervp -Ssound_file -ssound_file -Gmul -Z -Afft -alpc_inv 15 output_file ----------------------------------------------------------ggain <gain_factor or filename> or -gtremolo <mode> <filename> -gfilter <filter_parameters or filename>: amplitude modulation gain <filename>: multiplies output samples with envelope specified in file file contains lines with time envelope tremolo <mode> <filename> mode is the type of amplitude modulation sinus carre (square wave) triangle scie (sawtooth wave) file contains lines with time depth filter <parameters or file> filter signal using a linear filter that implements o(n) = sum_i b_i x(n-i*K) - sum_j a_j o(n-j*L). the filter parameters b_i,a_j are either specified directly on the command line or in the parameter file. The format is : K,b_0,b_1,...;L,a_0,a_1,.. If a_0 is not equal 1 all a_i are normalized by a_0. The semicolon can be replaced by means of a slash / ------ Examples: -ggain file -gtremolo sinus file -gfilter 1,1,0.2;3,1,0.5 ----------------------------------------------------------H<sample rate> : specifies new sampling rate the header of the sound file will be changed If this option is used, don’t use -A and -Z. ------ Example: -H32000 ----------------------------------------------------------Ii<step> or -Ii<method> <filename> or -I<num/mem> <step> or Ii<pos> filename step: specifies analysis step the step for analysis is in samples (Def I : max(1,min(window_size/8,window_size/time_dilation/8)) 173 33 Annexes (Def i : step size track 1 /*length track 2/length track 1) <method> is the method for reading parameter file name num same as giving a numerical value (no parameter file) mem input is callback (only for use in svp library applications) sync ordered pairs in parameter file (time, fundamental frequency) (not working) dep ordered pairs in parameter file (time, step value) (not working) pos sample position in the sound file is given for each window, the additional step will be used as virtual step (vstep) for the analysis and resynthesis. This parameter is only needed when resynthesis (-Z) is requested. The file consists of lines containing: single position (ex: 10000.) : indicating the sample position to read the next frame The frame is positioned in the output stream with location given by vstep. : indicating a repositioning of the frame position without really creating any output. : indicating a target position The frame increment is calculated automatically and a sequence of frames is created that stops with the last frame having its center at position "pos". : automatically move forward until a new position can be read from the parameter file, only useful if reading from a named pipe. Position increment is the same as with "u pos" : automatically move backward until a new position can be read from the parameter file, only useful if reading from a named pipe. Position increment is the same as with "u pos" "c" followed by pos (ex: c 10000.) "u" followed by pos (ex: u 10000.) "f" "b" ------ Examples: -I256 -Ipos posfile example posfile: u 30000 c 100000 u 30000 c 100000 u 200000 (: (: (: (: (: read frames until sample position position frame at sample position read frames backward until sample position frame at sample position read frames until sample position The sequence of position commands will process the file 174 30000) 100000) pos 30000) 100000) 200000) 33 Annexes and apply all treatments using the sound segment between sample 0 and sample 200000 with the special effect to reverse the sound samples located between sample 30000 and 100000. ----------------------------------------------------------J<type> : specifies synthesis window type (Def:same as the principal track) supported windows see -W ----------------------------------------------------------logfile filename : sets message output file to filename, the filename stderr is treated as special indicator for stderr output ----------------------------------------------------------Mm<window size> or -M<method> <filename> : specifies analysis window size the window size for analysis is in samples (Def: 1024) <method> is the method for reading the parameter file name num same as giving a numerical value (no parameter file) sync ordered pairs in parameter file (time, fundamental frequency) !!currently not supported!! dep ordered pairs in parameter file (time, window size) !!currently not supported!! ------ Examples: -M2000 -Mdep file ----------------------------------------------------------N<FFT size> : specifies FFT size the FFT size in samples (Def: 1024) must be greater than window size, see -Mm ------ Examples: -N4096 -N8192 ----------------------------------------------------------nn do not normalize output sound file (this is default now)! ATTENTION : The use of -nn is strongly discouraged. Since version 1.75 no normalization is the default behavior and -nn flag is no longer supported and will be switched of in future versions! See -norm flag ---------------------------------------------------------------------norm [level (Def.: 0)] normalize output sound file to level dB below maximum range of the output data type. 0dB normalization produces data in the range between +/- 1.0 for floating point sample format and in the range between +/- (2^(N-1)-1 for N Bit integer sample format. NORMALIZATION Behavior changed!! If -norm option is not given normalization is NOT performed. IMPORTANT : when normalizing, SuperVP uses a temporary file. It’s length is 175 33 Annexes the same length of the processed sound file when using 32bit floating point packing mode or twice the length when using 16bit short packing mode. Temporary file is created in SVPTMP (setenv SVPTMP mytemporarydirectory). When SVPTMP is not set, SFDIR is used. If SFDIR is not set, current directory is used. If the chosen directory is not writable, then /var/tmp is used. ---------------------------------------------------------------------ns requests spectral normalization for analysis output, which results in amplitude values to be below 1 (Def: no normalization) ----------------------------------------------------------oversamp <val> : specfies the minimum overlap of analysis and synthesis windows. The maximum increment between successive windows is specified in terms of parts of the window size (Def: 8). Smaller values indicate less overlap which results in less quality but also reduced computational costs. The default value (increment not larger then an 8-th part of the window) ensures very high quality for all situations. Values above 4 will be almost always sufficent. For values below 4 artifacts are unlikely but may occur. Minimum value is 2. ------ Examples: -oversamp 4 ----------------------------------------------------------P[tp] : switches on phase synchronization (Def: no phase sync) and possibly transient preservation mode for time dilation (see -D) or newfreeze modul. It generally improves amplitude reproduction and decreases the phasiness when processing non stationary sounds. This switch will be ignored if no dilation/newfreeze is requested. Transient preservation is switched on if the tp is larger than 0 (Def: no transient preservation/tp=0). Transient preservation localizes transients peaks in time/frequency domain and re-initializes phases for the related bins after the transient has passed in order to keep the wave form of the transient. transient detection parameters can be changed by means of -td_thresh/-td_G/-td_nument/-td_band/... ----------------------------------------------------------Rr<samplerate> : specifies sampling rate used when performing resynthesis on analysis data file ----------------------------------------------------------resS <value> : specifies stopband attenuation of the interpolation filter 176 33 Annexes used for resampling (Def: 70dB)! The window size and oversampling of the interpolation filter are automatically adjusted to achieve the requested attenuation of aliasing resulting from the interpolation process! To prevent excessive filter sizes attenuation of more than 140dB are not recommended. ----------------------------------------------------------t :displays the current processing time in the input file ----------------------------------------------------------T :displays the current processing time in the output file ----------------------------------------------------------td_int : switch to require integration of mean time for transient detection over td_nument peaks. This will improve robustness against detection of noise (Def: 2) ---- Example: -td_int ----------------------------------------------------------td_thresh <value> : adjust threshold of peak mean time (center of gravity of the energy of the signal related to the peak) to detect a transient peak (Def: 1.4). The mean time to end a transient is related to the mean time of a simple ramp covered by the analysis window. The amount of access mean time to detect a start of a transient is determined by td_thresh. By increasing td_thresh the transients need to be more pronounced with respect to the noise background to be detected as transient. The parameter is required to be above 1 because other wise the transient would be ended before it began. Optimal thresholds depend on the noise in the signal and on the confidence threshold determined by -td_G, however, a range between 1.2 2.5 is usually reasonable. ---- Example: -td_thresh 2 ----------------------------------------------------------td_G <value> : confidence factor to use when comparing the number of attack transient peaks in the transient statistic bands current frame and comparing it to the number of attack transients in the related band in the previous frame. The larger the value the higher the number of attack transient peaks in the current frame needs to be to be detected as part of an attack transient. The value denotes the access of the transient peak 177 33 Annexes frequency estimated in previous frames in terms of the standard deviation (Def: 2.5) ---- Example: -td_G 2 Reduce transient attack confidence by requesting only an access of 2 times the standard deviation for a band to be detected as transient. ----------------------------------------------------------td_band <value,value> : band in Hz used for transient detection. only spectral peaks within the band will be used to determine transient regions. (Def: 0,sample rate/2) See: -td_nument ----------------------------------------------------------td_nument <value> : band size used for the statistical monitoring of noise related background transient activity. Band size is specified in terms a number of peaks (mainlobe width) that fit into the band (Def: 10). This parameter controls the impact of a single transient peak for the detector. The smaller the number of peaks in the band the more impact a single sinusoid has. The allows to detect transients more sensitively even if they are close to stationary signals. At the same time it will increase the probability of false detections in noisy regions. ---- Example: -td_nument 30 requires to collect transient statistics in bands that may hold 30 stationary sinusoidal peaks. See: -td_G -----------------------------------------------------------td_ampfac <value> : specifies factor to use to compensate the missing contributions from previous frames when restarting after a attack transient (Def: 1.8). ---- Example: -td_ampfac 1. 178 33 Annexes when restarting phases after attack transient multiply amplitude by 1. instead of default value 1.8. This will remove the compensation of the missing amplitude info from the frames before the attack transient has been restarted. ----------------------------------------------------------td_mina <value> : specifies minimum amplitude that an attack transient needs to achieve to be detected (Def: 0). The amplitude reference is interpreted as a normalized value. ---- Example: -td_mina 0.01 ----------------------------------------------------------td_nosync : requires to not syncronize transients detected in different channels of a multi channel audio file. Per default the transients of the different channels are synchronized to prevent the artifacts resulting from the fact that the transients in the different channels may be detected at different places or may be detected only in one of the channels. ---- Example: -td_nosync ----------------------------------------------------------td_declick <value> : specifies maximum duration of click events in seconds. All transients that start sound events of duration shorter than the given duration will be removed from the signal. ---- Example: -td_declick 6.3492e-04 Removes clicks that have been detected as transients with duration shorter than 0.63492ms. Note that click removal is related to transient detection and therefore it will only work if the -D (with any argument) and the -P1 flag have been given on the command line. ----------------------------------------------------------trans <cents> or <filename> : transposes by the given number of cents applying time correction to compensate the duration effects of transposition by means of resampling. Transposition requires the -A and -Z flag. For time varying transposition a parameter file has to be used which contains lines with: 179 33 Annexes time transposition Which are linearly interpolated. Since supervp 2.40 the trans flag may be given more than once in which case the effective transpositions are added. transpositions are always extrapolated outside the range specified in the parameter file. ------ Example: -trans 1200 (will transpose one octave up) -transnc <cents> or <filename> : Applies transposition without time correction. The perceived pitch is changed by means of sample rate conversion without changing the samplerate of the resulting signal. Therefore the length of the sound will be changed. The parameters or parameter files and are equal to the -trans flag. -trans and -transnc flags may be given more than once even with overlap in which case the requested transpositions are added but will only be partly compensated. ------ Example: -transnc 1200 (will transpose one octave up) ----------------------------------------------------------truelpc : do not apply any normalization after lpc in the analysis section. Intended for using lpc analysis for lpc filtering. ----------------------------------------------------------Uu : specifies the position of the first window with respect to the first sample (Def: window centered at first sample) -U/-u moves the window such that its first sample matches the first sample of the sound. ----------------------------------------------------------v :prints out details about the SVP patch structure and parameters ----------------------------------------------------------Ww<type> : specifies analysis window type the analysis window type (Def: hanning) supported windows: rectangular (rect, rectangle) triangular (triangle) hamming hanning blackman exactblackman ------ Example: -Wblackman ----------------------------------------------------------Z : performs a resynthesis (inverse FFT and overlap/add) 180 33 Annexes ---------------------------------------------------------Output options :: ================= <output filename> The outputfile is specified without option switch as last parameter of the command line. If no output file is specified or the name of the file is "stdout" the result is directed to stdout. if the name of the output file is "@PLAY@" the output is not stored as a file but directly played as sound via the audio hardware The default latency is 0.5 sec and can be changed by means of adding a float number to the play file name. For example @[email protected] would indicate play the sound with latency 0.2 sec -O<mode>:<list> or -O<mode> <file> <mode> is the output type (b) SOUND modes : sa for AIFF/AIFC 16bit integer soundfile format. sA8,sA16,sA24,sA32 select the different sample size in bits sAf,sAd select float or double samples in AIFC format. sA equivalent to Sa sis for Ircam 16bit integer soundfile format. sif for Ircam 32bit float soundfile format. sw for wav 16bit integer sound file format. sw8,sw16,sw24,sw32 select the different sample size in bits swf,swd select float or double samples in WAV format. sW equivalent to sw. sn for NeXT 16bit integer soundfile format. ss for Mac Sounddesigner II format srs for raw 16bit integer soundfile. srf for raw 32bit float soundfile. IMPORTANT : default format and packing mode (integer or float) differ according to the output type (a file or a pipe): File output : those of the input processed sound (not normalized). Pipe output : raw 32bit float (not normalized). ANALYSIS Output Modes : a for ASCII analysis data output b for binary analysis data output (default) g0 : Unified file format, data is log amplitude stored as unsigned char g1,g2,g3,g4,g5: Unified file format, see below and gabarit filter S0,S1,S2,S3,S4,S5: Unified file format stored as SDIF file T : sdif file containing description of attack transients F+,F: sdif file containing local maxima of averaged spectral differences (add selects regions with increasing (+) 181 33 Annexes or decreasing (-) amplitude for difference evaluation, Def: +) M1,M2: : averaged spectral information for all segments specified via -avseg flag. Output is stored in an SDIF file in an 1AVS/1AVS Matrix following an IAVS frame denoting analysis infos. The M1 mode outputs the mean and standard deviation of the absolute spectrum for each bin, the M2 mode outputs maximum and standard dev. of the absolute spectrum for each bin. Note, that the power spectrum can be derived from M1 results by (mean*mean + stddev*stddev)! Format ( binary file + header like gabarit file ) using FFT, LPC, CEPSTRE. File content is respectively t,amp ; t,phase ; t,amp,phase ; t,freq,amp ; t,pr,pi. g1,g2 formats work with gabarit filtering and g4,g5 ones work with the synthesis module with data on input channel. g3 format works with both. Use these format with -Oxx option (no more arguments on command line) ------------- Ex : -Og3 Using other format arguments will print a warning but the right output format will be set. <list> is a list of strings separated by ’,’ number, time, amplitude, frequency, phase, etc.. <file> is a text file where output format is specified ------ Examples: -Oa:number,amplitude,phase -Oa foo.format ---------------------------------------------------------List of available strings as output data t,time: time (of frame) number: number (of entries per frame) a,amp,ampl,amplitude: linear amplitude adb,amp_db,ampl_db,amplitude_db: amplitude in dB pr,partie_reelle: real part of a complex number pi,partie_imaginaire: imaginary part of a complex number f,fhz,freq,frequence: frequency in Hz midicents,fmc: frequency in midicents i,ind,index: frequency as fft-index chan,chan_freq: center frequency of fft-channel ph,phase: phase spl: sound press excess weight: harmonic weight tsp,truesp,truepitch: harmonic true pitch sc,score: score coeff,coeff_pitch: pitch confidence largeur,largeur_formant: formant width cf,coeff_filtre: autoregressive lpc filter coefficients 182 33 Annexes ------------------------ Allowed combinations ----------------------fft cepstre masquage f0 formant lpc partie_reelle OK, OK, NO, NO, NO, OK partie_imagin OK, OK, NO, NO, NO, OK frequence_hz OK, OK, OK, OK, OK, OK frequ_cents OK, OK, OK, OK, OK, OK frequ_midicents OK, OK, OK, OK, OK, OK frequ_inst OK, OK, NO, NO, NO, OK amplitude_lin OK, OK, OK, OK, OK, OK amplitude_dB OK, OK, OK, OK, OK, OK phase OK, OK, NO, NO, NO, OK sndpressexcess NO, NO, OK, NO, NO, NO truepitch NO, NO, OK, NO, NO, NO weight NO, NO, OK, NO, NO, NO score f0 NO, NO, NO, OK, NO, NO coef pitch NO, NO, NO, OK, NO, NO largeur formant NO, NO, NO, NO, OK, NO coeff filtre LPC NO, NO, NO, OK, NO, OK 33.2 SuperVP -hf =================================================== SuperVP (IRCAM) 1990-2005 version : 2.59j fix-1 (compiled by niels for AudioSculpt on Wed Jan 26 17:45:54 GMT 2005) Prec=double =================================================== Filter module description :: ============================ bande,bande-noex,band-transp,band-noex-transp : applies a band pass/band stop filter with possibly time varying band edges. The parameter file contains multiple lines of Example: time num bandtype f0 f1 f2 .... fnum time positions description in time num number of band edge frequencies to follow each pair of frequencies constitutes a band so num has to be even bandtype bands given are pass=1 or stop=0 bands fi num frequencies that specify the edges of the alternating pass/stop bands included into the band are those freq. bins that are min(edge1,edge2) <= freq <= max(edge1,edge2) The edge frequencies are grouped into bands regarding their position in the file. Consequently the bands may self-intersect. The lower edge of the band is always min(edge1,edge2) while the upper edge is max(edge1,edge2). 183 33 Annexes For time varying filters only the fi entries may change with time. Extrapolation: In normal operation the first and last lines of the parameter file are extrapolated without changes to start/end of sound. If the flag -noex is appended to the filter type the filter will not be extrapolated but only applied inside the time limits specified in the parameter file Transparency: If -transp is added to the filter type the filter behavior is changed with respect to the mode of superposition CombineMax. In this case pass bands are considered transparent with respect to filter superposition such that they are not included in selecting the maximum value of the transfer function. -------------------------------------------------------breakpt breakpt-noex breakpt-transp breakpt-noex-transp: These filters applies a piece wise linear description of a time varying or constant frequency response specified in dB/rad. The parameter may contain an ASCII or binary description of the filter. In the binary case the file has to start with the 8 characters BPBINARY. The parameter file consists of sets of numbers describing the filter as a break point function for a given time, as follows: time mode numpairs freq value freq value time(float): time position to apply following filter response definition mode(int): filter mode (0=amplitude/1=phase/2=amplitude and phase) mode parameter can not change within a single file numpairs(int): number of freq-value breakpoints to follow in current line freq value(float): depending of the selected mode pair or triple of values describing a break point of the frequency response freq [Hz] and amplitude [dB] for mode = 0 freq [Hz] and phase [rad] for mode = 1 freq [Hz], amplitude [dB] and phase [rad] for mode = 2 The type given in parenthesis is the data type of the entries for the binary parameter file. The break point description is extended over the full frequency 184 33 Annexes range using a constant extrapolation of the start and end break points. The envelopes amplitude and phase values for each frequency bin are linearly interpolated over time and extended to the start and end of the file using constant extrapolation. For correct interpolation the phase values are required to be unwrapped! For instantaneous changes with respect to time or frequency you may give the same frequency or time value twice. Example for breakpt file using amplitude mode : 0.1 0 4 100 0 500 -30 1000 -30 4000 0 0.5 0 5 100 0 500 -30 1000 -30 4000 -10 5000 0 This file would attenuate the amplitudes in the region between 100 and 4000Hz to 100 and 5000Hz respectively. Extrapolation: In normal operation the first and last lines of the parameter file are extrapolated without changes to start/end of sound. If the flag -noex is appended to the filter type the filter will not be extrapolated but only applied inside the time limits specified in the parameter file Transparency: If -transp is added to the filter type the filter behavior and parameter file is changed with respect to the mode of superposition CombineMax. In this case the first floating point number in the parameter file is the transparent value of the filter with respect to filter superposition. Filter transfer function values that are equal to this value are not included in selecting the maximum value of the transfer function. -------------------------------------------------------clip, clip-norm: apply clipping filter within time slices of the sound. The clipping filter clips all amplitudes of a spectrum above the upper threshold and rescales the amplitudes between lower threshold and upper threshold to lie between 0 and upper threshold A clipping filter can be described in two modes: First mode describes a clipping filter operating on the whole sound file: Example: low_threshold high_threshold this will result in applying clipping with the given parameters globally for the whole sound or Example: low_threshold high_threshold start_time end_time 185 33 Annexes this will apply the respective clipping parameters only within the specified time region. Multiple lines may be specified. For overlapping regions the first region takes precedence thresholds parameters are assumed to be in dB with respect to a normalized amplitude spectrum (max. = 0dB) Normalization: if the special type clip-norm is specified the clipping filter rescales the resulting signal to preserve the signal energy. -------------------------------------------------------denoise: clipping all amplitudes inside a time frequency surface that are below the specified clipping value to zero. The parameter file is equivalent to the surface filter with the gain parameter specifying a clipping level in dB relative to the maximum of a normalized spectrum (0dB). -------------------------------------------------------fof fof-noex fifof fifof-noex: filtering applies a collection of second order resonance or formant filters to the sound signal. The file consists of lines containing time numfof freq gain band ... time: numfof: start time for the following parameters number of formats to follow then numfof format descriptions each specifying freq: fof resonance freq in Hz gain: amplitude gain at resonance freq in dB bandwidth: formant bandwidth in Hz In case of fof the number of formant filters has to be the same throughout the file and the parameters for each formant are linearly interpolated. In case of fifof the number of formants can change and interpolation with respect to time is achieved by interpolating the resulting transfer functions. example: fifof.par 0.1 1 440 0 50 0.2 2 440 0 50 880 -2 100 0.3 3 440 0 50 880 -2 100 1760 -4 200 186 33 Annexes Extrapolation: In normal operation the first and last lines of the parameter file are extrapolated without changes to start/end of sound. If the flag -noex is appended to the filter type the filter will not be extrapolated but only applied inside the time limits specified in the parameter file -------------------------------------------------------fshift: this filter applies a time varying frequency shift to the signal the parameter file contains a breakpoint description of the shift to apply at a given time point in Hertz. The first and last parameter are extended till the start/end of the sound respectively example: 0.1 -50. this file would shift the sound down by 50Hz. NOTE: due to the internal representation you may not combine a frequency shift filter with time stretching or transposition. -------------------------------------------------------gabarit: apply a fft analysis output file that has been stored in gabarit format as a filter to the input sound file. The gabarit mode has to be 1 (amplitude only), 2 (phase only) or 3 for amplitude and phase filtering (See option -Og). Since SuperVP 1.83 the filter analysis data sampling rate and fftsize are no longer required to match the respective values for the filtered sound. Any mismatch will result in a proper resampling of the filter data using linear interpolation of phase and amplitude (amplitude interpolated in log domain) such that the frequency response is kept. Gabarit format description All the different formats share a common file header specifying gabarit mode (4 byte int) sample rate (4 byte float) soundfilenamelen (4 byte int) soundfilenamechars (namelen chars) 187 33 Annexes The length of the input sound file is always including the limiting zero byte of a c-string and rounded up to regard a 4 byte boundary, the unused part of the name is filled with zeros. Following the file header are the frames each with a unified frame header consisting of frameCenterTime nbdata windowSize frameSize (4 (4 (4 (4 byte byte byte byte float) int) int) int) The samplerate is used to derive the data spacing in frequency as samplerate/(nbdata-1)/2. Windowsize is used to adjust the phase prior to using it by adding/subtracting a linear phase component that compensates for the center of the window being shifted (windowsize-1)/2 away from the start of the frame. Framesize is not used for filtering and can be left 0. After each header there are nbdata multi element values. The meaning of the values depend on the mode and are: mode | data ============================== 1 | single amplitude 2 | single phase value 3 | pair of amplitude and phase value 4 | pair of frequency and amplitude value (not suitable for filtering) 5 | pair of real imaginary value (not suitable for filtering) All data points are in 32 bit float format The phase interpolation is done after phase unwrapping. Therefore, the maximal spacing of synthetic phase transfer functions has to be selected such that phase differences of the phase transfer function between the bins are smaller then PI. -------------------------------------------------------surface : Applies constant gain to a piece wise linear surface of the spectrogram. The parameter file contains multiple lines for each surface, and may contain multiple surfaces. General syntax First line of a surface: start_time num end_time gain_dB start_time/end_time: the minimum and maximum time covered by that surface. num: the number of lines to follow describing the shape of the surface. 188 33 Annexes gain_dB: The fixed attenuation/amplification for this surface. surface description is given by num lines of format time low_freq high_freq time: specifies the time the description applies low_freq/high_freq: specify the frequency boundaries (end points belonging to the surface) for the given time. The description specifies a piece wise linear bounded surface in the time/frequency plane. The start_time/end_time locations of the surface are centered between the first and last frequency boundary pairs. Due to this format only convex surfaces can be described. Example for single surface with 0.0 4 5.0 -40 1.0 1000 2000 2.0 1000 2000 3.0 2000 3000 4.0 2000 3000 40dB attenuation: Time and frequency values have to be non decreasing. Superposition of different surfaces will respect the selected superposition mode. -------------------------------------------------------sub, sub-det, sub-noex, sub-noex-det: spectral subtraction filter will subtract time interpolated noise spectrum that has been created via -OM1/-OM2 output option from noise segments specified via -avseg option from the signal spectrum. The spectral subtraction allows fine control via additional command line parameters: -avsfac, -avbeta, -avgamma, -avrelax. The parameter file contains the spectral description of the noise spectra for all the segments. According to the selected description mode the first column contains the mean or maximum value M(k) for each bin k and the current segment. The second column contains the standard deviation S(k) of the bin for the current segment. The noise estimate for bin k is given by NE(k) = M(k) + 10^(avsfac/20) * S(k) If we denote NI(k) the interpolation of the two noise estimates from the neighboring segments contained in the parameter file the spectral subtraction module would create the output amplitude spectrum O(k) from the input amplitude I(k) spectrum following O(k) = max(0,Gl(k)*I(k)) with the generalized spectral subtraction factor 189 33 Annexes G(k) = max(sum_bark([1-[NI(k)/I(k)]^avgamma]^(1/avgamma)),10^(avbeta/20)) Gl(k) = max(Gl(k) * exp(-td/(avrelax/1000)),G(k)) G(k) will be close to 1 if the input amp. spectrum is larger than the noise estimate and become small if the input amp. spectrum approaches the noise estimate. Gl provides a means to modify the decay rate of the spectral subtraction factor. To prevent musical noise the spectral subtraction factor G(k) is always averaged over the bark band related to bin k. Meaning of command line parameters: ---------------------------------avbeta : controls remaining noise floor (maximum spectral attenuation is given by avbeta). see: control flag -avbeta avgamma : switches between amplitude (gamma=1) and energy (gamma=2) subtraction. see: control flag -avgamma avsfac : controls impact of standard deviation on the noise estimate and establishes a means to obtain over/under-compensation. see: control flag -avsfac avrelax : do not decrease Gl(k) faster than with an relaxation time constant. avrelax is given in milliseconds. see: control flag -avrelax Deterministic noise: ==================== By adding the flag -det to the filter type special treatment of stationary sinusoids in the noise estimate is requested. Sinusoids are detected from the averaged spectrum and removed below the noise level prior to applying spectral subtraction. Extrapolation: In normal operation the first and last lines of the parameter file are extrapolated without changes to start/end of sound. If the flag -noex is appended to the filter type the filter will not be extrapolated but only applied inside the time limits specified in the parameter file --------------------------------------------------------avbeta <noise floor value> : Specifies the noise floor to keep when applying the spectral subtraction filter. The value is specified in dB. (Def: -100dB) 190 33 Annexes name is given this file should contain pairs of start and end times of segments that will be used to calculate averaged spectra. If the flag is followed by two numbers they are used as start and end times of the next segment to be added to the list of segments. The parameter can be specified multiple times, however, the segment positions need to be in increasing time order. ---- Example: -avbeta -20 Limits noise attenuation in the spectral subtraction filter to 20dB. See: sub filter module ----------------------------------------------------------avsfac <standard deviation multiplicand> : Specifies the factor to multiply with the noise standard deviation for estimating the noise amplitude spectrum in the spectral subtraction filter (Def: 0). ---- Example: -avsfac 1. Adds one time the standard deviation to the mean amplitude to obtain the noise estimate. See: sub filter module ----------------------------------------------------------avgamma <1 or 2> : Specifies amplitude or energy subtraction mode for the spectral subtraction filter (Def: 1). ---- Example: -avgamma 2 Selects energy control instead for amplitude control for the spectral subtraction filter. See: sub filter module ----------------------------------------------------------avrelax <relaxation time constant> : specifies the time constant in ms for the decay of the generalized filter factor in the spectral subtraction filter (Def: 0.). ---- Example: -avrelax 20. 191 33 Annexes Relaxation time constant of generalized subtraction filter set to 20ms. See: sub filter module ---------------------------------------------------------- 192