Débruitage des signaux audio
Transcription
Débruitage des signaux audio
Introduction Evaluation Suppression des craquements Suppression du bruit de fond Débruitage des signaux audio M. Charbit Département du Traitement du Signal et des Images Laboratoire de Transmission et de Communication de l’Information-UMR5141 GET-Télécom Paris M. Charbit Débruitage des signaux audio - 1/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond 1 Introduction 2 Evaluation 3 Suppression des craquements Modélisation des signaux Détection des craquements Restauration des valeurs Résultats 4 Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah M. Charbit Débruitage des signaux audio - 2/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Origines Conditions de la prise de sons, microphones, position du microphone, Conditions de propagation : réverbération, effet additif de réflexions multiples d’un signal acoustique, échos, propagation à travers un canal, Bruit d’origine électrique/électronique des dispositifs, Distorsions non linéaires : écrêtage, Bruit de quantification introduit par les opérations de codage/décogage, Imperfection et/ou détérioration des supports, effacement. M. Charbit Débruitage des signaux audio - 3/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Origines Conditions de la prise de sons, microphones, position du microphone, Conditions de propagation : réverbération, effet additif de réflexions multiples d’un signal acoustique, échos, propagation à travers un canal, Bruit d’origine électrique/électronique des dispositifs, Distorsions non linéaires : écrêtage, Bruit de quantification introduit par les opérations de codage/décogage, Imperfection et/ou détérioration des supports, effacement. M. Charbit Débruitage des signaux audio - 3/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Origines Conditions de la prise de sons, microphones, position du microphone, Conditions de propagation : réverbération, effet additif de réflexions multiples d’un signal acoustique, échos, propagation à travers un canal, Bruit d’origine électrique/électronique des dispositifs, Distorsions non linéaires : écrêtage, Bruit de quantification introduit par les opérations de codage/décogage, Imperfection et/ou détérioration des supports, effacement. M. Charbit Débruitage des signaux audio - 3/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Origines Conditions de la prise de sons, microphones, position du microphone, Conditions de propagation : réverbération, effet additif de réflexions multiples d’un signal acoustique, échos, propagation à travers un canal, Bruit d’origine électrique/électronique des dispositifs, Distorsions non linéaires : écrêtage, Bruit de quantification introduit par les opérations de codage/décogage, Imperfection et/ou détérioration des supports, effacement. M. Charbit Débruitage des signaux audio - 3/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Origines Conditions de la prise de sons, microphones, position du microphone, Conditions de propagation : réverbération, effet additif de réflexions multiples d’un signal acoustique, échos, propagation à travers un canal, Bruit d’origine électrique/électronique des dispositifs, Distorsions non linéaires : écrêtage, Bruit de quantification introduit par les opérations de codage/décogage, Imperfection et/ou détérioration des supports, effacement. M. Charbit Débruitage des signaux audio - 3/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Origines Conditions de la prise de sons, microphones, position du microphone, Conditions de propagation : réverbération, effet additif de réflexions multiples d’un signal acoustique, échos, propagation à travers un canal, Bruit d’origine électrique/électronique des dispositifs, Distorsions non linéaires : écrêtage, Bruit de quantification introduit par les opérations de codage/décogage, Imperfection et/ou détérioration des supports, effacement. M. Charbit Débruitage des signaux audio - 3/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Dans la suite on s’intéresse principalement au Craquement : impulsion de durée brève (quelques échantillons), d’amplitude aléatoire, apparaissant en un instant aléatoire, Bruit de fond : un processus aléatoire “stationnaire” centré. M. Charbit Débruitage des signaux audio - 4/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Dans la suite on s’intéresse principalement au Craquement : impulsion de durée brève (quelques échantillons), d’amplitude aléatoire, apparaissant en un instant aléatoire, Bruit de fond : un processus aléatoire “stationnaire” centré. M. Charbit Débruitage des signaux audio - 4/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Objectifs Les objectifs du débruitage varient en fonction de la demande, citons par exemple : Amélioration de l’intelligibilité, Amélioration de la qualité du son, Modifications qui conduisent à une amélioration des performances des systèmes de reconnaissance, Modifications qui conduisent à une amélioration des performances des systèmes de codage et/ou de transmission. traitement en temps réel/différé, mono/multicapteurs, référence de bruit seul ou d’autres formes d’a priori sur le bruit et/ou le signal utile. M. Charbit Débruitage des signaux audio - 5/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Intelligibilité : test phonétique, “mot" isolé cad une suite de syllabes étant ou non un mot de la langue, phrase intelligible et phonétiquement équilibrée (avec ou sans signification), Qualité : test par évaluation absolue ou test de préférence relative. MOS pour Mean Opinion Score Score 5 4 3 2 1 qualité Excellent Good Fair Poor Bad niveau de distorsion distorsion imperceptible perceptible, mais pas gênant perceptible et un peu gênant gênant, mais pas excessivement désagréable très gênant et excessivement désagréable M. Charbit Débruitage des signaux audio - 6/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Intelligibilité : test phonétique, “mot" isolé cad une suite de syllabes étant ou non un mot de la langue, phrase intelligible et phonétiquement équilibrée (avec ou sans signification), Qualité : test par évaluation absolue ou test de préférence relative. MOS pour Mean Opinion Score Score 5 4 3 2 1 qualité Excellent Good Fair Poor Bad niveau de distorsion distorsion imperceptible perceptible, mais pas gênant perceptible et un peu gênant gênant, mais pas excessivement désagréable très gênant et excessivement désagréable M. Charbit Débruitage des signaux audio - 6/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Intelligibilité : test phonétique, “mot" isolé cad une suite de syllabes étant ou non un mot de la langue, phrase intelligible et phonétiquement équilibrée (avec ou sans signification), Qualité : test par évaluation absolue ou test de préférence relative. MOS pour Mean Opinion Score Score 5 4 3 2 1 qualité Excellent Good Fair Poor Bad niveau de distorsion distorsion imperceptible perceptible, mais pas gênant perceptible et un peu gênant gênant, mais pas excessivement désagréable très gênant et excessivement désagréable M. Charbit Débruitage des signaux audio - 6/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Observation d’un craquement F IGURE: Signal provenant d’un enregistrement sur disque en vinyle et comportant un craquement. M. Charbit Débruitage des signaux audio - 7/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Modèle pour le signal utile La détection de la présence d’un craquement est liée au fait qu’une petite partie du signal ne semble pas pouvoir se prédire à partir de l’ensemble des autres valeurs de la trame. D’où l’idée d’utiliser un modèle de prédiction valeur prédite s’écrit alors : ... linéaire. La ŝn = α1 sn−1 + · · · + αP sn−P Mais on hésite à dire que sn = ŝn . D’où l’idée d’introduire un terme d’écart, ce qui conduit à l’expression : sn = α1 sn−1 + · · · + αP sn−P + wn où le terme wn est supposé être un processus aléatoire stationnaire, blanc, centré et de variance σ 2 . M. Charbit Débruitage des signaux audio - 8/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Modèle pour le signal utile La détection de la présence d’un craquement est liée au fait qu’une petite partie du signal ne semble pas pouvoir se prédire à partir de l’ensemble des autres valeurs de la trame. D’où l’idée d’utiliser un modèle de prédiction valeur prédite s’écrit alors : ... linéaire. La ŝn = α1 sn−1 + · · · + αP sn−P Mais on hésite à dire que sn = ŝn . D’où l’idée d’introduire un terme d’écart, ce qui conduit à l’expression : sn = α1 sn−1 + · · · + αP sn−P + wn où le terme wn est supposé être un processus aléatoire stationnaire, blanc, centré et de variance σ 2 . M. Charbit Débruitage des signaux audio - 8/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Modèle pour le signal utile La détection de la présence d’un craquement est liée au fait qu’une petite partie du signal ne semble pas pouvoir se prédire à partir de l’ensemble des autres valeurs de la trame. D’où l’idée d’utiliser un modèle de prédiction valeur prédite s’écrit alors : ... linéaire. La ŝn = α1 sn−1 + · · · + αP sn−P Mais on hésite à dire que sn = ŝn . D’où l’idée d’introduire un terme d’écart, ce qui conduit à l’expression : sn = α1 sn−1 + · · · + αP sn−P + wn où le terme wn est supposé être un processus aléatoire stationnaire, blanc, centré et de variance σ 2 . M. Charbit Débruitage des signaux audio - 8/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Modèle AR-P Un tel modèle de signal que nous réécrivons sn + a1 sn−1 + · · · + aP sn−P = wn est appelé un processus auto-régressif (AR) d’ordre P. M. Charbit Débruitage des signaux audio - 9/60 (1) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Modèle pour les clicks On suppose que les clicks sont des impulsions localisées en un point temporel, d’amplitude A et de position n0 aléatoires, ce que nous notons : i(n) = Aδ(n − n0 ) M. Charbit Débruitage des signaux audio - 10/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Hypothèses pour les clicks les clicks sont peu nombreux. Sur les enregistrements proposés on a observé moins de 1% de clicks, soit moins de 4 à 5 clicks sur une fenêtre de 400 points. la durée des clicks est très petite. Elle va de quelques dizaines à quelques centaines de µs. Pour un signal échantillonné à 44100 Hz, cela correspond à un nombre d’échantillons dégradés qui va de 1 à 10. Lors de l’opération de restauration, le nombre de points à restaurer est un paramètre à régler en fonction de la qualité d’écoute obtenue. M. Charbit Débruitage des signaux audio - 11/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Hypothèses pour les clicks les clicks sont peu nombreux. Sur les enregistrements proposés on a observé moins de 1% de clicks, soit moins de 4 à 5 clicks sur une fenêtre de 400 points. la durée des clicks est très petite. Elle va de quelques dizaines à quelques centaines de µs. Pour un signal échantillonné à 44100 Hz, cela correspond à un nombre d’échantillons dégradés qui va de 1 à 10. Lors de l’opération de restauration, le nombre de points à restaurer est un paramètre à régler en fonction de la qualité d’écoute obtenue. M. Charbit Débruitage des signaux audio - 11/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Hypothèses pour les clicks les clicks sont peu nombreux. Sur les enregistrements proposés on a observé moins de 1% de clicks, soit moins de 4 à 5 clicks sur une fenêtre de 400 points. la durée des clicks est très petite. Elle va de quelques dizaines à quelques centaines de µs. Pour un signal échantillonné à 44100 Hz, cela correspond à un nombre d’échantillons dégradés qui va de 1 à 10. Lors de l’opération de restauration, le nombre de points à restaurer est un paramètre à régler en fonction de la qualité d’écoute obtenue. M. Charbit Débruitage des signaux audio - 11/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Hypothèses pour les clicks les clicks sont peu nombreux. Sur les enregistrements proposés on a observé moins de 1% de clicks, soit moins de 4 à 5 clicks sur une fenêtre de 400 points. la durée des clicks est très petite. Elle va de quelques dizaines à quelques centaines de µs. Pour un signal échantillonné à 44100 Hz, cela correspond à un nombre d’échantillons dégradés qui va de 1 à 10. Lors de l’opération de restauration, le nombre de points à restaurer est un paramètre à régler en fonction de la qualité d’écoute obtenue. M. Charbit Débruitage des signaux audio - 11/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des paramètres AR−P Pour estimer les paramètres σ 2 , a1 ,. . ., aP , on fait comme s’il n’y avait pas de clicks dans la fenêtre d’analyse. Ceci est justifiée par le fait que le nombre supposé de clicks est faible dans une fenêtre. M. Charbit Débruitage des signaux audio - 12/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats En principe on doit aussi estimer P. En pratique sa valeur a été déterminée de façon empirique, entre 20 et 50, en évaluant a posteriori la qualité d’écoute. Remarquons que plus P est grand, plus les valeurs prédites s’ajustent aux observations. Par conséquent une trop grande valeur de P perd en terme de variabilité du modèle et réduit donc la capacité à détecter un craquement. On dit que l’on fait du sur-apprentissage. Inversement une valeur de P petite peut conduire à détecter un échantillon de signal utile comme un click. M. Charbit Débruitage des signaux audio - 13/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats En principe on doit aussi estimer P. En pratique sa valeur a été déterminée de façon empirique, entre 20 et 50, en évaluant a posteriori la qualité d’écoute. Remarquons que plus P est grand, plus les valeurs prédites s’ajustent aux observations. Par conséquent une trop grande valeur de P perd en terme de variabilité du modèle et réduit donc la capacité à détecter un craquement. On dit que l’on fait du sur-apprentissage. Inversement une valeur de P petite peut conduire à détecter un échantillon de signal utile comme un click. M. Charbit Débruitage des signaux audio - 13/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats En principe on doit aussi estimer P. En pratique sa valeur a été déterminée de façon empirique, entre 20 et 50, en évaluant a posteriori la qualité d’écoute. Remarquons que plus P est grand, plus les valeurs prédites s’ajustent aux observations. Par conséquent une trop grande valeur de P perd en terme de variabilité du modèle et réduit donc la capacité à détecter un craquement. On dit que l’on fait du sur-apprentissage. Inversement une valeur de P petite peut conduire à détecter un échantillon de signal utile comme un click. M. Charbit Débruitage des signaux audio - 13/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats En principe on doit aussi estimer P. En pratique sa valeur a été déterminée de façon empirique, entre 20 et 50, en évaluant a posteriori la qualité d’écoute. Remarquons que plus P est grand, plus les valeurs prédites s’ajustent aux observations. Par conséquent une trop grande valeur de P perd en terme de variabilité du modèle et réduit donc la capacité à détecter un craquement. On dit que l’on fait du sur-apprentissage. Inversement une valeur de P petite peut conduire à détecter un échantillon de signal utile comme un click. M. Charbit Débruitage des signaux audio - 13/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Equations de Yule-Walker On appelle k-ème coefficient de covariance du processus xn la quantité r(k) = E [xc (n + k)xc (n)] , avec xc (n) = x(n) − E [xn ] Pour un modèle AR-P, les équations dites de Yule-Walker fournissent une relation qui lie les coefficients du modèle avec les coefficients de covariance. Elles ont pour expression : R a = −r et σ 2 = r(0) − aT r M. Charbit Débruitage des signaux audio - 14/60 (2) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Equations de Yule-Walker On appelle k-ème coefficient de covariance du processus xn la quantité r(k) = E [xc (n + k)xc (n)] , avec xc (n) = x(n) − E [xn ] Pour un modèle AR-P, les équations dites de Yule-Walker fournissent une relation qui lie les coefficients du modèle avec les coefficients de covariance. Elles ont pour expression : R a = −r et σ 2 = r(0) − aT r M. Charbit Débruitage des signaux audio - 14/60 (2) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats où R est la matrice de covariance de dimension P qui s’écrit : r(0) · · · r(P − 1) .. .. .. R= . . . r(P − 1) · · · où r = r(1) · · · r(0) T r(P) et où a = a1 · · · M. Charbit T aP . Débruitage des signaux audio - 15/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des covariances On estime les covariances par les moments empiriques : r̂N (k) = N−k 1 X (xn+k − µ̂N )(xn − µ̂N ) N n=1 où N 1X µ̂N = xn N n=1 En pratique, N doit être choisi le plus grand possible tout en satisfaisant l’hypothèse de stationnarité. En parole, par exemple, les durées de stationnarité sont de l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence d’échantillonnage Fe = 44.1 kHz, à quelques centaines d’échantillons. M. Charbit Débruitage des signaux audio - 16/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des covariances On estime les covariances par les moments empiriques : r̂N (k) = N−k 1 X (xn+k − µ̂N )(xn − µ̂N ) N n=1 où N 1X µ̂N = xn N n=1 En pratique, N doit être choisi le plus grand possible tout en satisfaisant l’hypothèse de stationnarité. En parole, par exemple, les durées de stationnarité sont de l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence d’échantillonnage Fe = 44.1 kHz, à quelques centaines d’échantillons. M. Charbit Débruitage des signaux audio - 16/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des covariances On estime les covariances par les moments empiriques : r̂N (k) = N−k 1 X (xn+k − µ̂N )(xn − µ̂N ) N n=1 où N 1X µ̂N = xn N n=1 En pratique, N doit être choisi le plus grand possible tout en satisfaisant l’hypothèse de stationnarité. En parole, par exemple, les durées de stationnarité sont de l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence d’échantillonnage Fe = 44.1 kHz, à quelques centaines d’échantillons. M. Charbit Débruitage des signaux audio - 16/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des covariances On estime les covariances par les moments empiriques : r̂N (k) = N−k 1 X (xn+k − µ̂N )(xn − µ̂N ) N n=1 où N 1X µ̂N = xn N n=1 En pratique, N doit être choisi le plus grand possible tout en satisfaisant l’hypothèse de stationnarité. En parole, par exemple, les durées de stationnarité sont de l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence d’échantillonnage Fe = 44.1 kHz, à quelques centaines d’échantillons. M. Charbit Débruitage des signaux audio - 16/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des paramètres AR−P Pour estimer les coefficients du modèle, on remplace dans les équations de Yule-Walker (2) les moments statistiques par les moments empiriques correspondant. On obtient : â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂ où R̂ est la matrice de covariance empirique de dimension P × P et où r̂ = [r̂(1) . . . r̂(P)]T . On montre que le filtre récursif de réponse en fréquence 1 1 + â1 e−2jπf + · · · + âP e−2jπPf est causal P et stable. Ce qui signifie que le polynôme A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement à l’intérieur du cercle unité. M. Charbit Débruitage des signaux audio - 17/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des paramètres AR−P Pour estimer les coefficients du modèle, on remplace dans les équations de Yule-Walker (2) les moments statistiques par les moments empiriques correspondant. On obtient : â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂ où R̂ est la matrice de covariance empirique de dimension P × P et où r̂ = [r̂(1) . . . r̂(P)]T . On montre que le filtre récursif de réponse en fréquence 1 1 + â1 e−2jπf + · · · + âP e−2jπPf est causal P et stable. Ce qui signifie que le polynôme A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement à l’intérieur du cercle unité. M. Charbit Débruitage des signaux audio - 17/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des paramètres AR−P Pour estimer les coefficients du modèle, on remplace dans les équations de Yule-Walker (2) les moments statistiques par les moments empiriques correspondant. On obtient : â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂ où R̂ est la matrice de covariance empirique de dimension P × P et où r̂ = [r̂(1) . . . r̂(P)]T . On montre que le filtre récursif de réponse en fréquence 1 1 + â1 e−2jπf + · · · + âP e−2jπPf est causal P et stable. Ce qui signifie que le polynôme A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement à l’intérieur du cercle unité. M. Charbit Débruitage des signaux audio - 17/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Estimation des paramètres AR−P Pour estimer les coefficients du modèle, on remplace dans les équations de Yule-Walker (2) les moments statistiques par les moments empiriques correspondant. On obtient : â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂ où R̂ est la matrice de covariance empirique de dimension P × P et où r̂ = [r̂(1) . . . r̂(P)]T . On montre que le filtre récursif de réponse en fréquence 1 1 + â1 e−2jπf + · · · + âP e−2jπPf est causal P et stable. Ce qui signifie que le polynôme A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement à l’intérieur du cercle unité. M. Charbit Débruitage des signaux audio - 17/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Test d’hypothèses Le problème de la détection des clicks peut se formuler comme un test à deux hypothèses : ( Hypothèse H0 d’absence de click : xn = sn Hypothèse H1 de présence de click : xn = sn + Aδn−n0 L’approche adoptée consiste à effectuer un filtrage linéaire des observations x1 , · · · , xN , puis de comparer les sorties obtenues à une seuil. Il est à noter que cette façon de procéder est optimale si le processus sn est gaussien. M. Charbit Débruitage des signaux audio - 18/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Test d’hypothèses Le problème de la détection des clicks peut se formuler comme un test à deux hypothèses : ( Hypothèse H0 d’absence de click : xn = sn Hypothèse H1 de présence de click : xn = sn + Aδn−n0 L’approche adoptée consiste à effectuer un filtrage linéaire des observations x1 , · · · , xN , puis de comparer les sorties obtenues à une seuil. Il est à noter que cette façon de procéder est optimale si le processus sn est gaussien. M. Charbit Débruitage des signaux audio - 18/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Test d’hypothèses Le problème de la détection des clicks peut se formuler comme un test à deux hypothèses : ( Hypothèse H0 d’absence de click : xn = sn Hypothèse H1 de présence de click : xn = sn + Aδn−n0 L’approche adoptée consiste à effectuer un filtrage linéaire des observations x1 , · · · , xN , puis de comparer les sorties obtenues à une seuil. Il est à noter que cette façon de procéder est optimale si le processus sn est gaussien. M. Charbit Débruitage des signaux audio - 18/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats On applique, tout d’abord, le filtre de blanchiment de fonction de transfert A(z) associé au modèle AR d’ordre P. Le problème précédent est équivalent au test suivant : ( Hypothèse H0 d’absence de click : yn = wn Hypothèse H1 de présence de click : yn = wn + Aan−n0 où wn est un bruit blanc. On est donc ramené au problème de la détection d’une impulsion de forme connue a(n) dans un bruit blanc. La solution est fournie par le filtre adapté de réponse impulsionnelle a(−n) suivi d’un détecteur qui compare le module du signal de sortie du filtre à un seuil. M. Charbit Débruitage des signaux audio - 19/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats On applique, tout d’abord, le filtre de blanchiment de fonction de transfert A(z) associé au modèle AR d’ordre P. Le problème précédent est équivalent au test suivant : ( Hypothèse H0 d’absence de click : yn = wn Hypothèse H1 de présence de click : yn = wn + Aan−n0 où wn est un bruit blanc. On est donc ramené au problème de la détection d’une impulsion de forme connue a(n) dans un bruit blanc. La solution est fournie par le filtre adapté de réponse impulsionnelle a(−n) suivi d’un détecteur qui compare le module du signal de sortie du filtre à un seuil. M. Charbit Débruitage des signaux audio - 19/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats On applique, tout d’abord, le filtre de blanchiment de fonction de transfert A(z) associé au modèle AR d’ordre P. Le problème précédent est équivalent au test suivant : ( Hypothèse H0 d’absence de click : yn = wn Hypothèse H1 de présence de click : yn = wn + Aan−n0 où wn est un bruit blanc. On est donc ramené au problème de la détection d’une impulsion de forme connue a(n) dans un bruit blanc. La solution est fournie par le filtre adapté de réponse impulsionnelle a(−n) suivi d’un détecteur qui compare le module du signal de sortie du filtre à un seuil. M. Charbit Débruitage des signaux audio - 19/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Détection des craquements En conclusion on a le traitement représenté figure 2 suivi d’un détecteur à seuil. F IGURE: Détection des craquements. Le détecteur compare le module du signal en sortie du filtre à un seuil. M. Charbit Débruitage des signaux audio - 20/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Détermination du seuil Sous l’hypothèse gaussienne, le seuil de décision η qui correspond à une probabilité de fausse alarme égale à α est donné par : q η = λ(α) σ 1 + a21 + · · · + a2P où α 7→ λ vérifie : Z +∞ λ 1 2 √ e−t /2 dt = α/2 2π On a λ(0.05) = 1.96. M. Charbit Débruitage des signaux audio - 21/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats F IGURE: Restauration Montrons qu’une approche des moindres carrés conduit à l’expression suivante de l’estimateur : b y = −(BT B)−1 BT (A0 x0 + A1 x1 ) M. Charbit Débruitage des signaux audio - 22/60 (3) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Le problème est de minimiser N P X X (xt + ak xt−k )2 t=1 k=1 par rapport à (x` , . . . , x`+m−1 ) . . . minimiser : T E E= `+m+P−1 X e2t où et = ce qui est équivalent à P X ak xt−k avec a0 = 1 k=0 t=` M. Charbit Débruitage des signaux audio - 23/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Le problème est de minimiser N P X X (xt + ak xt−k )2 t=1 k=1 par rapport à (x` , . . . , x`+m−1 ) . . . ce qui est équivalent à minimiser : T E E= `+m+P−1 X e2t où et = P X ak xt−k avec a0 = 1 k=0 t=` M. Charbit Débruitage des signaux audio - 23/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Sous forme matricielle E s’écrit aP aP−1 · · · a0 0 0 a a · · · a P P−1 0 E = . . . . . . 0 ··· 0 aP ··· 0 aP−1 · · · ··· x0 · · · y =A 0 x 1 a0 x0 y x1 où A est une matrice de dimension (m + P) × (m + 2P) et où T T y = (x` · · · x`+m−1 ) , x0 = (x`−P · · · x`−1 ) et T x1 = (x`+m · · · x`+m+P ) . M. Charbit Débruitage des signaux audio - 24/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Sous forme bloc-matrice E s’écrit encore : x0 E = A0 B A1 y = A0 x0 + A1 x1 + By x1 Le problème revient à déterminer y qui minimise la norme de E pour le modèle linéaire : A0 x0 + A1 x1 = −By + E la solution est donnée par : b y = −(BT B)−1 BT (A0 x0 + A1 x1 ) M. Charbit Débruitage des signaux audio - 25/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats Sous forme bloc-matrice E s’écrit encore : x0 E = A0 B A1 y = A0 x0 + A1 x1 + By x1 Le problème revient à déterminer y qui minimise la norme de E pour le modèle linéaire : A0 x0 + A1 x1 = −By + E la solution est donnée par : b y = −(BT B)−1 BT (A0 x0 + A1 x1 ) M. Charbit Débruitage des signaux audio - 25/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Détection des craquements Restauration des valeurs Résultats F IGURE: Craquement (trait bleu en pointillé), signal restauré (trait rouge). M. Charbit Débruitage des signaux audio - 26/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Suppression du bruit de fond On ne dispose que d’une seule copie de l’enregistrement, ce qui condamne les méthodes de type multicapteurs, On dispose d’une référence de bruit, ce qui permet d’estimer ses propriétés spectrales. Principe : analyse spectrale à court-terme (en anglais STSA pour Short Term Spectral Analysis) M. Charbit Débruitage des signaux audio - 27/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Suppression du bruit de fond On ne dispose que d’une seule copie de l’enregistrement, ce qui condamne les méthodes de type multicapteurs, On dispose d’une référence de bruit, ce qui permet d’estimer ses propriétés spectrales. Principe : analyse spectrale à court-terme (en anglais STSA pour Short Term Spectral Analysis) M. Charbit Débruitage des signaux audio - 27/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Suppression du bruit de fond On ne dispose que d’une seule copie de l’enregistrement, ce qui condamne les méthodes de type multicapteurs, On dispose d’une référence de bruit, ce qui permet d’estimer ses propriétés spectrales. Principe : analyse spectrale à court-terme (en anglais STSA pour Short Term Spectral Analysis) M. Charbit Débruitage des signaux audio - 27/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Modèle de signal Les signaux sont échantillonnés à la fréquence Fe . On note xn = sn + bn pour n ∈ {0, · · · , N − 1} (4) les signaux observés. On suppose que bn est un processus aléatoire stationnaire au second ordre, gaussien, centré. On note γB (f ) sa densité spectrale. M. Charbit Débruitage des signaux audio - 28/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Modèle de signal Les signaux sont échantillonnés à la fréquence Fe . On note xn = sn + bn pour n ∈ {0, · · · , N − 1} (4) les signaux observés. On suppose que bn est un processus aléatoire stationnaire au second ordre, gaussien, centré. On note γB (f ) sa densité spectrale. M. Charbit Débruitage des signaux audio - 28/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Analyse spectrale à court-terme (Short-Time Spectral Analysis Le signal est segmenté en trames de longueur N avec un recouvrement de P points. On note (x(`(N − P), · · · , x(`(N − P) + N − 1) la `-ème trame. La transformée de Fourier discrète s’écrit : X(`, k) = N−1 X wN (n)x(`(N − P) + n)e−2jπkn/N n=0 où k = 0 · · · N − 1 et où wN désigne une fenêtre de pondération (typiquement rectangulaire, Hamming ou Hann) vérifiant P 2 −1/2 . n wN (n) = 1. Pour la fenêtre rectangulaire wN (n) = N M. Charbit Débruitage des signaux audio - 29/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Analyse spectrale à court-terme (Short-Time Spectral Analysis Le signal est segmenté en trames de longueur N avec un recouvrement de P points. On note (x(`(N − P), · · · , x(`(N − P) + N − 1) la `-ème trame. La transformée de Fourier discrète s’écrit : X(`, k) = N−1 X wN (n)x(`(N − P) + n)e−2jπkn/N n=0 où k = 0 · · · N − 1 et où wN désigne une fenêtre de pondération (typiquement rectangulaire, Hamming ou Hann) vérifiant P 2 −1/2 . n wN (n) = 1. Pour la fenêtre rectangulaire wN (n) = N M. Charbit Débruitage des signaux audio - 29/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Modèles de signal Par linéarité de la TFD, on a Xk = Sk + Bk où Sk et Bk désignent respectivement les STSA de sn et bn . N correspond en parole à une durée de stationnarité de 20 à 40 ms. Soit N de l’ordre de quelques centaines à Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est de l’ordre de quelques dizaines de Hz. P: le recouvrement conseillé est typiquement de 50% à 75%. On distingue principalement : le spectre d’amplitude : |Xk |, le spectre de puissance ou périodogramme : N −1 |Xk |2 M. Charbit Débruitage des signaux audio - 30/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Modèles de signal Par linéarité de la TFD, on a Xk = Sk + Bk où Sk et Bk désignent respectivement les STSA de sn et bn . N correspond en parole à une durée de stationnarité de 20 à 40 ms. Soit N de l’ordre de quelques centaines à Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est de l’ordre de quelques dizaines de Hz. P: le recouvrement conseillé est typiquement de 50% à 75%. On distingue principalement : le spectre d’amplitude : |Xk |, le spectre de puissance ou périodogramme : N −1 |Xk |2 M. Charbit Débruitage des signaux audio - 30/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Modèles de signal Par linéarité de la TFD, on a Xk = Sk + Bk où Sk et Bk désignent respectivement les STSA de sn et bn . N correspond en parole à une durée de stationnarité de 20 à 40 ms. Soit N de l’ordre de quelques centaines à Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est de l’ordre de quelques dizaines de Hz. P: le recouvrement conseillé est typiquement de 50% à 75%. On distingue principalement : le spectre d’amplitude : |Xk |, le spectre de puissance ou périodogramme : N −1 |Xk |2 M. Charbit Débruitage des signaux audio - 30/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Modèles de signal Par linéarité de la TFD, on a Xk = Sk + Bk où Sk et Bk désignent respectivement les STSA de sn et bn . N correspond en parole à une durée de stationnarité de 20 à 40 ms. Soit N de l’ordre de quelques centaines à Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est de l’ordre de quelques dizaines de Hz. P: le recouvrement conseillé est typiquement de 50% à 75%. On distingue principalement : le spectre d’amplitude : |Xk |, le spectre de puissance ou périodogramme : N −1 |Xk |2 M. Charbit Débruitage des signaux audio - 30/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Evaluations On effectue en général un traitement en fréquence cad . . . un filtrage linéaire de gain en fréquence H(f ). Pour évaluer les performances on considère : R E |sn |2 Ss (f )df =R SNRi : E [|bn |2 ] Sb (f )df R E |ŝn |2 |H(f )|2 Ss (f )df R h i SNRo : = |H(f )|2 Sb (f )df E |b̂n |2 R E |sn − ŝn |2 |1 − H(f )|2 Ss (f )df R = DI : E [|ŝn |2 ] Ss (f )df M. Charbit Débruitage des signaux audio - 31/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Evaluations On effectue en général un traitement en fréquence cad . . . un filtrage linéaire de gain en fréquence H(f ). Pour évaluer les performances on considère : R E |sn |2 Ss (f )df SNRi : =R E [|bn |2 ] Sb (f )df R E |ŝn |2 |H(f )|2 Ss (f )df R h i SNRo : = |H(f )|2 Sb (f )df E |b̂n |2 R E |sn − ŝn |2 |1 − H(f )|2 Ss (f )df R = DI : E [|ŝn |2 ] Ss (f )df M. Charbit Débruitage des signaux audio - 31/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Evaluations On effectue en général un traitement en fréquence cad . . . un filtrage linéaire de gain en fréquence H(f ). Pour évaluer les performances on considère : R E |sn |2 Ss (f )df SNRi : =R E [|bn |2 ] Sb (f )df R E |ŝn |2 |H(f )|2 Ss (f )df R h i SNRo : = |H(f )|2 Sb (f )df E |b̂n |2 R E |sn − ŝn |2 |1 − H(f )|2 Ss (f )df R = DI : E [|ŝn |2 ] Ss (f )df M. Charbit Débruitage des signaux audio - 31/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Evaluations On effectue en général un traitement en fréquence cad . . . un filtrage linéaire de gain en fréquence H(f ). Pour évaluer les performances on considère : R E |sn |2 Ss (f )df SNRi : =R E [|bn |2 ] Sb (f )df R E |ŝn |2 |H(f )|2 Ss (f )df R h i SNRo : = |H(f )|2 Sb (f )df E |b̂n |2 R E |sn − ŝn |2 |1 − H(f )|2 Ss (f )df R = DI : E [|ŝn |2 ] Ss (f )df M. Charbit Débruitage des signaux audio - 31/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Expressions en fréquence On suppose que les composantes Sk et Bk sont gaussiennes complexes, centrées, indépendantes, de 2covariances 2 2 2 respectives σS = E |Sk | et σB = E |Bk | . Il s’ensuit que E |Xk |2 = E |Sk |2 + E |Bk |2 , M. Charbit et E [Xk∗ Sk ] = E |Sk |2 Débruitage des signaux audio - 32/60 (5) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Expressions en fréquence On suppose que les composantes Sk et Bk sont gaussiennes complexes, centrées, indépendantes, de 2covariances 2 2 2 respectives σS = E |Sk | et σB = E |Bk | . Il s’ensuit que E |Xk |2 = E |Sk |2 + E |Bk |2 , M. Charbit et E [Xk∗ Sk ] = E |Sk |2 Débruitage des signaux audio - 32/60 (5) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah On suppose que l’on effectue un traitement linéaire de la forme Ŝk = gk Xk On cherche les gains en fréquence gk qui minimisent l’écart quadratique défini par : J(gk ) = E |Sk − gk Xk |2 M. Charbit Débruitage des signaux audio - 33/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah On suppose que l’on effectue un traitement linéaire de la forme Ŝk = gk Xk On cherche les gains en fréquence gk qui minimisent l’écart quadratique défini par : J(gk ) = E |Sk − gk Xk |2 M. Charbit Débruitage des signaux audio - 33/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah En annulant la dérivée par rapport à gk il vient : E [Xk∗ (Sk − gk Xk )] = 0 Il s’ensuit que le gain, qui minimise le risque à la fréquence k, a pour expression : gk = E [Xk∗ Sk ] E [|Xk |2 ] qui porte le nom de filtrage de Wiener. M. Charbit Débruitage des signaux audio - 34/60 (6) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustraction spectrale En utilisant (5), on obtient : E |Bk |2 E |Sk |2 =1− (7) gk = E [|Xk |2 ] E [|Xk |2 ] En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces espérances peuvent être estimées de la façon suivante : une approximation de E |Bk |2 est donnée par une estimation de la densité spectrale au point de fréquence kFe /N. une approximation de E |Xk |2 est donnée |Xk |2 . Finalement on a : gk ≈ 1 − M. Charbit γ̂B (k) |Xk |2 Débruitage des signaux audio - 35/60 (8) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustraction spectrale En utilisant (5), on obtient : E |Bk |2 E |Sk |2 =1− (7) gk = E [|Xk |2 ] E [|Xk |2 ] En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces espérances peuvent être estimées de la façon suivante : une approximation de E |Bk |2 est donnée par une estimation de la densité spectrale au point de fréquence kFe /N. une approximation de E |Xk |2 est donnée |Xk |2 . Finalement on a : gk ≈ 1 − M. Charbit γ̂B (k) |Xk |2 Débruitage des signaux audio - 35/60 (8) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustraction spectrale En utilisant (5), on obtient : E |Bk |2 E |Sk |2 =1− (7) gk = E [|Xk |2 ] E [|Xk |2 ] En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces espérances peuvent être estimées de la façon suivante : une approximation de E |Bk |2 est donnée par une estimation de la densité spectrale au point de fréquence kFe /N. une approximation de E |Xk |2 est donnée |Xk |2 . Finalement on a : gk ≈ 1 − M. Charbit γ̂B (k) |Xk |2 Débruitage des signaux audio - 35/60 (8) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustraction spectrale En utilisant (5), on obtient : E |Bk |2 E |Sk |2 =1− (7) gk = E [|Xk |2 ] E [|Xk |2 ] En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces espérances peuvent être estimées de la façon suivante : une approximation de E |Bk |2 est donnée par une estimation de la densité spectrale au point de fréquence kFe /N. une approximation de E |Xk |2 est donnée |Xk |2 . Finalement on a : gk ≈ 1 − M. Charbit γ̂B (k) |Xk |2 Débruitage des signaux audio - 35/60 (8) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustraction spectrale En utilisant (5), on obtient : E |Bk |2 E |Sk |2 =1− (7) gk = E [|Xk |2 ] E [|Xk |2 ] En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces espérances peuvent être estimées de la façon suivante : une approximation de E |Bk |2 est donnée par une estimation de la densité spectrale au point de fréquence kFe /N. une approximation de E |Xk |2 est donnée |Xk |2 . Finalement on a : gk ≈ 1 − M. Charbit γ̂B (k) |Xk |2 Débruitage des signaux audio - 35/60 (8) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Bruit musical Du fait de la grande variance du périodogramme (cad |Xk |2 , on a tendance à accentuer de façon aléatoire, d’une trame à l’autre, le gain et donc les composantes du bruit correspondantes, ce qui produit un sifflement peu naturel désigné sous le nom de bruit musical. M. Charbit Débruitage des signaux audio - 36/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Bruit musical Du fait de la grande variance du périodogramme (cad |Xk |2 , on a tendance à accentuer de façon aléatoire, d’une trame à l’autre, le gain et donc les composantes du bruit correspondantes, ce qui produit un sifflement peu naturel désigné sous le nom de bruit musical. M. Charbit Débruitage des signaux audio - 36/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Pour réduire le bruit musical on peut sur-estimer le niveau du bruit. C’est le rôle du paramètre λ dans l’expression (9). forcer le gain à une valeur plancher lorsque le rapport signal sur bruit passe en dessous d’un certain seuil. C’est le rôle du paramètre η dans l’expression (9). On peut aussi effectuer une moyenne sur les périodogrammes sur plusieurs trames adjacentes. M. Charbit Débruitage des signaux audio - 37/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustractions spectrales proposées Des variantes de la soustraction spectrale ont été proposées par la suite. En particulier on a considéré des gains en fréquence de la forme Ŝk = gk Xk avec ) ( (|Xk |α − λµ̂B,α (k))1/α 1/α , η µ̂B,α (k) (9) gk = max |Xk | µ̂B,α est estimé par une analyse spectrale à cour-terme, M. Charbit Débruitage des signaux audio - 38/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Soustractions spectrales proposées Des variantes de la soustraction spectrale ont été proposées par la suite. En particulier on a considéré des gains en fréquence de la forme Ŝk = gk Xk avec ) ( (|Xk |α − λµ̂B,α (k))1/α 1/α , η µ̂B,α (k) (9) gk = max |Xk | µ̂B,α est estimé par une analyse spectrale à cour-terme, M. Charbit Débruitage des signaux audio - 38/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah λ > 1. L’augmentation du coefficient λ réduit le bruit résiduel, mais peut introduire une distorsion du signal si sa valeur est trop élevée, en particulier si la puissance du bruit est constante tandis que la puissance du signal utile varie d’une trame à l’autre. D’où l’idée de faire varier λ d’une trame à l’autre en le choisissant d’autant plus petit que le rapport signal sur bruit est grand. où α > 0, typiquement α = 1 ou α = 2, 0 ≤ η 1. Il est conseillé de prendre pour η des valeurs comprises entre 0.005 et 0.1. M. Charbit Débruitage des signaux audio - 39/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah λ > 1. L’augmentation du coefficient λ réduit le bruit résiduel, mais peut introduire une distorsion du signal si sa valeur est trop élevée, en particulier si la puissance du bruit est constante tandis que la puissance du signal utile varie d’une trame à l’autre. D’où l’idée de faire varier λ d’une trame à l’autre en le choisissant d’autant plus petit que le rapport signal sur bruit est grand. où α > 0, typiquement α = 1 ou α = 2, 0 ≤ η 1. Il est conseillé de prendre pour η des valeurs comprises entre 0.005 et 0.1. M. Charbit Débruitage des signaux audio - 39/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah MMSE : Ephraïm et Malah On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est gaussien, on en déduit que pUk Φk (uk , φk ) = uk 2 2 e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π)) 2 πσS (k) qui montre que les variables aléatoires Uk et Φk sont indépendantes. On pose Xk = Sk + Bk = Vk eiΘk De l’hypothèse d’indépendance de Sk et Bk , on déduit que 1 1 jφk 2 pXk |Uk ,Φk (xk , uk , φk ) = exp − 2 |xk − uk e | πσB2 (k) σB (k) M. Charbit Débruitage des signaux audio - 40/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah MMSE : Ephraïm et Malah On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est gaussien, on en déduit que pUk Φk (uk , φk ) = uk 2 2 e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π)) 2 πσS (k) qui montre que les variables aléatoires Uk et Φk sont indépendantes. On pose Xk = Sk + Bk = Vk eiΘk De l’hypothèse d’indépendance de Sk et Bk , on déduit que 1 1 jφk 2 pXk |Uk ,Φk (xk , uk , φk ) = exp − 2 |xk − uk e | πσB2 (k) σB (k) M. Charbit Débruitage des signaux audio - 40/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah MMSE : Ephraïm et Malah On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est gaussien, on en déduit que pUk Φk (uk , φk ) = uk 2 2 e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π)) 2 πσS (k) qui montre que les variables aléatoires Uk et Φk sont indépendantes. On pose Xk = Sk + Bk = Vk eiΘk De l’hypothèse d’indépendance de Sk et Bk , on déduit que 1 1 jφk 2 pXk |Uk ,Φk (xk , uk , φk ) = exp − 2 |xk − uk e | πσB2 (k) σB (k) M. Charbit Débruitage des signaux audio - 40/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah MMSE : Ephraïm et Malah On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est gaussien, on en déduit que pUk Φk (uk , φk ) = uk 2 2 e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π)) 2 πσS (k) qui montre que les variables aléatoires Uk et Φk sont indépendantes. On pose Xk = Sk + Bk = Vk eiΘk De l’hypothèse d’indépendance de Sk et Bk , on déduit que 1 1 jφk 2 pXk |Uk ,Φk (xk , uk , φk ) = exp − 2 |xk − uk e | πσB2 (k) σB (k) M. Charbit Débruitage des signaux audio - 40/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah La loi conjointe de (Uk , Vk ) s’obtient en intégrant sur φ et θ, ce qui donne : u2 pUk Vk (uk , vk ) = v2 +u2 − 2k − k2 k 4uk vk σ (k) σB (k) S e e I0 σS2 (k)σB2 (k) 2uk vk σB2 (k) 1 (uk ≥ 0, vk ≥ 0) et donc v2 +u2 2vk − k2 k pVk |Uk (uk , vk ) = 2 e σB (k) I0 σB (k) M. Charbit 2uk vk σB2 (k) 1 (uk ≥ 0, vk ≥ 0) Débruitage des signaux audio - 41/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah F IGURE: Densité de probabilité de β = Vk2 /σB2 (k) (échelle en dB) sachant α = Uk2 /σB2 (k) pour α = {0, 4, 8, 12, 16} dB. M. Charbit Débruitage des signaux audio - 42/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah La “meilleure” estimation de Uk sachant Xk est donnée par E [Uk |Xk ]. Le calcul montre que Ûk = E [Uk |Xk ] = gk Vk On rappelle que E Vk2 = E Uk2 + E |Bk |2 M. Charbit Débruitage des signaux audio - 43/60 (10) Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah où √ √ π ξk gk = exp(−νk /2) νk 2 1 + ξk 1 1+ √ I0 (νk /2) + I1 (νk /2) νk (11) avec E Uk2 ξk = 2 σB (k) Vk2 σB2 (k) ξk νk = ζk 1 + ξk λk = (ζk − 1) ζk = M. Charbit RSBPRIO RSBPOST RSBINST Débruitage des signaux audio - 44/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah où √ √ π ξk gk = exp(−νk /2) νk 2 1 + ξk 1 1+ √ I0 (νk /2) + I1 (νk /2) νk (11) avec E Uk2 ξk = 2 σB (k) Vk2 σB2 (k) ξk νk = ζk 1 + ξk λk = (ζk − 1) ζk = M. Charbit RSBPRIO RSBPOST RSBINST Débruitage des signaux audio - 44/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah où √ √ π ξk gk = exp(−νk /2) νk 2 1 + ξk 1 1+ √ I0 (νk /2) + I1 (νk /2) νk (11) avec E Uk2 ξk = 2 σB (k) Vk2 σB2 (k) ξk νk = ζk 1 + ξk λk = (ζk − 1) ζk = M. Charbit RSBPRIO RSBPOST RSBINST Débruitage des signaux audio - 44/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah où √ √ π ξk gk = exp(−νk /2) νk 2 1 + ξk 1 1+ √ I0 (νk /2) + I1 (νk /2) νk (11) avec E Uk2 ξk = 2 σB (k) Vk2 σB2 (k) ξk νk = ζk 1 + ξk λk = (ζk − 1) ζk = M. Charbit RSBPRIO RSBPOST RSBINST Débruitage des signaux audio - 44/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah RSBPRIO F IGURE: Gain d’Ephraïm et Malah en fonction du RSB a priori ξk et du RSB instantané λk . M. Charbit Débruitage des signaux audio - 45/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Dans ce cas où le RSBPRIO est faible, l’atténuation est importante même si le RSBINST est grand. Cette correction a quelque chose qui peut paraître non intuitif dans la mesure, où quand le RSBINST est grand, on pourrait penser qu’il faut une atténuation faible. Cependant c’est précisément ce comportement qui réduit le bruit musical. Il s’ensuit, en effet, que les grandes valeurs du spectre, lorsque le RSBPRIO est faible, sont “tirées" vers le bas. Par ce moyen, l’algorithme évite l’apparition de “paquets” de raies si jamais le bruit venait à excéder ses caractéristiques moyennes. N’oublions pas qu’un bruit gaussien excède sa moyenne avec une probabilité 1/2. D’où l’idée éventuellement, de “sur-estimer” légèrement le niveau moyen du bruit. M. Charbit Débruitage des signaux audio - 46/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Dans ce cas où le RSBPRIO est faible, l’atténuation est importante même si le RSBINST est grand. Cette correction a quelque chose qui peut paraître non intuitif dans la mesure, où quand le RSBINST est grand, on pourrait penser qu’il faut une atténuation faible. Cependant c’est précisément ce comportement qui réduit le bruit musical. Il s’ensuit, en effet, que les grandes valeurs du spectre, lorsque le RSBPRIO est faible, sont “tirées" vers le bas. Par ce moyen, l’algorithme évite l’apparition de “paquets” de raies si jamais le bruit venait à excéder ses caractéristiques moyennes. N’oublions pas qu’un bruit gaussien excède sa moyenne avec une probabilité 1/2. D’où l’idée éventuellement, de “sur-estimer” légèrement le niveau moyen du bruit. M. Charbit Débruitage des signaux audio - 46/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Dans ce cas où le RSBPRIO est faible, l’atténuation est importante même si le RSBINST est grand. Cette correction a quelque chose qui peut paraître non intuitif dans la mesure, où quand le RSBINST est grand, on pourrait penser qu’il faut une atténuation faible. Cependant c’est précisément ce comportement qui réduit le bruit musical. Il s’ensuit, en effet, que les grandes valeurs du spectre, lorsque le RSBPRIO est faible, sont “tirées" vers le bas. Par ce moyen, l’algorithme évite l’apparition de “paquets” de raies si jamais le bruit venait à excéder ses caractéristiques moyennes. N’oublions pas qu’un bruit gaussien excède sa moyenne avec une probabilité 1/2. D’où l’idée éventuellement, de “sur-estimer” légèrement le niveau moyen du bruit. M. Charbit Débruitage des signaux audio - 46/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Estimation du RSBPRIO D’après les définitions précédentes, on a à la fois : E Uk2 et ξk = E [ζk − 1] ξk = 2 σB (k) Ephraïm et Malah en déduisent l’algorithme adaptatif suivant : 2 2 (t − 1)V 2 (t − 1) V (t) g k k k + (1 − α)P −1 (12) ξˆk (t) = α σB2 (k) σB2 (k) où P(x) = x1 (x ≥ 0). M. Charbit Débruitage des signaux audio - 47/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Estimation du RSBPRIO D’après les définitions précédentes, on a à la fois : E Uk2 et ξk = E [ζk − 1] ξk = 2 σB (k) Ephraïm et Malah en déduisent l’algorithme adaptatif suivant : 2 2 (t − 1)V 2 (t − 1) g V (t) k k k ξˆk (t) = α + (1 − α)P −1 (12) σB2 (k) σB2 (k) où P(x) = x1 (x ≥ 0). M. Charbit Débruitage des signaux audio - 47/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Tarun Agarwal. Pre-Processing of Noisy Speech for Voice Coders. PhD thesis, Department of Electrical and Computer Engineering, McGill University, Montreal, Canada, 2002. M. Berouti, R. Schwartz, and J. Makhoul. Enhancement of speech corrupted by acoustic noise. Proceedings of the IEEE ICASSP’79, Washington, 1979, pages 208–211, 1979. S.F. Boll. Suppression of acoustic noise in speech using spectral substraction. IEEE Trans. on ASSP, pages 113–120, Apr. 1979. M. Charbit Débruitage des signaux audio - 48/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah S. Canazza, G. de Poli, S. Maesano, and G. Mian. On the performance of a noise reduction technique based on a psychoacoustic model for restoration of old audio recordings. Proc. of the COST G-6 Conference on DAFX, Dec. 2000. O. Cappé. Elimination of musical noise phenomenon with the Ephraim and Malah noise suppressor. IEEE ASSP 2(2), pages 345–349, Apr. 1994. M. Charbit and O. Cappé. Restauration d’enregistrements sonores anciens : du traitement du signal aux applications grand public. REE. Revue de l’électricité et de l’électronique, pages 40–43, 1997. M. Charbit Débruitage des signaux audio - 49/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah I. Cohen. Noise spectrum estimation in adverse environments : Improved minima controlled recursive averaging. IEEE Transactions on Speech and Audio Processing, 10, 2002. I. Cohen. On the decision-directed estimation approach of ephraim and malah. ICASSP, pages 293–296, 2004. I. Cohen. Speech enhancement using a noncausal a priori snr estimator. IEEE Signal Processing Letters, Vol. 11, No. 9, pages 725–728, September 2004. M. Charbit Débruitage des signaux audio - 50/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Y. Ephraim and D. Malah. Speech enhancement using a MMSE short-time spectral amplitude estimator. IEEE ASSP-32, pages 1109–1121, Dec 1984. Y. Ephraim and D. Malah. Speech enhancement using a MMSE error log-spectral amplitude estimator. IEEE ASSP-33, pages 443–445, Apr 1985. Y. Ephraim and D. Malah. Noisy speech enhancement using discrete cosine transform. Speech Communication, 24 :249–257, 1998. M. Charbit Débruitage des signaux audio - 51/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah Y. Ephraim and H. Van Trees. A signal subspace approach for speech enhancement. IEEE Transactions on Speech and Audio Processing, vol. 3, pages 251–266, 1995. E.Zavarehei, S. Vaseghi, and Q. Yan. Speech enhancement using kalman filters for restauration of short-time dft trajectories. Automatic Speech Recognition and Understanding (ASRU) 2005 IEEE Workshop Vol. 27, pages 219 – 224, November 2005. S. Godsill and P. Rayner. Digital audio restoration. Springer-verlag, 1998. M. Charbit Débruitage des signaux audio - 52/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah T. Gülzow, A. Engelsberg, and U. Heute. Comparaison of a discret wavelet transform and a non uniform polyphase filterbank applied to spectral-subtraction speech enhancement. SP-64, pages 5–19, 1998. F. Jabloun and B. Champagne. Incorporating the human hearing properties in the signal subspace approach for speech enhancement. EEE Trans Speech and Audio Processing, 11 :700–708, 2003. M. Charbit Débruitage des signaux audio - 53/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah S. H. Jensen, P. C. Hansen, S. D. Hansen, and J. A. Sorensen. Reduction of broad-band noise in speech by truncated qsvd. IEEE Transactions on Speech and Audio Processing, vol. 3, pages 439–448, 1995. H. Lev-Ari and Y. Ephraim. Extension of the signal subspace speech enhancement approach to colored noise. IEEE Signal Processing Letters, 10 :104–106, 2003. M. Charbit Débruitage des signaux audio - 54/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah R. Martin. Speech enhancement based on minimum mean-square error estimation and supergaussian priors. EEE Trans Speech and Audio Processing, 13 :845–856, 2005. R. Martin. Statistical Methods for the Enhancement of Noisy Speech. Springer-Verlag, 2006. R. Martin and R. Cox. New speech enhancement techniques for low bit rate speech coding. Proc IEEE Wkshp on Speech Coding, pages 165–167, 1999. M. Charbit Débruitage des signaux audio - 55/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah R. Martin, D. Malah, R. Cox, and A. Accardi. A noise reduction preprocessor for mobile voice communication. EURASIP Journal on Applied Signal Processing, 8 :1046–1058, 2004. L. Rabiner and R Schafer. Digital Processing of Speech Signals. Prentice-Hall, 1978. Sundarrajan Rangachari and Philipos C. Loizou. A noise-estimation algorithm for highly non-stationary environments. Speech Communication, vol. 48, pages 220–231, 2006. M. Charbit Débruitage des signaux audio - 56/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah R.Veldhuis. Restoration of lost samples in digital signals. Prentice-Hall, 1990. N. Sasaoka, N. Sasaoka, K. Sumi, Y. Itoh, and K. Fujii. A new noise reduction system based on ale and noise reconstruction filter. IEEE International Symposium on Circuits and Systems (ISCAS), 1 :272–275, 2005. N. Sasaoka, N. Sasaoka, M. Watanabe, Y. Itoh, and K. Fujii. Noise reduction system based on lpef and system identification with variable step size. IEEE International Symposium on Circuits and Systems (ISCAS), pages 2311–2314, 2007. M. Charbit Débruitage des signaux audio - 57/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah P. Scarlat and J. Vieira. Speech enhancement based on a priori signal to noise estimation. Inter. Conference on ASSP, pages 629–632, 1996. B. Sim, Y. Tong, J. Chang J., and C. Tan. A parametric formulation of the generalized spectral subtraction method. IEEE Transactions on Speech and Audio Processing, vol. 6, No. 4, pages 328–337, July 1998. VAD. Special issue on standardization and characterization of g.729. IEEE Communications Magazine, Sept. 1997. M. Charbit Débruitage des signaux audio - 58/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah P.D. Welch. The use of fast fourier transform for the estimation of power spectra : A method based on time averaging over short, modified periodograms. IEEE Transactions on Audio Electroacoustics, Volume AU-15, pages 70–73, June 1967. P. Wolfe and S. Godsill. Simple alternatives to the ephraim and malah suppression rule for speech enhancement. 11th IEEE Workshop on Statistical Signal Processing, Singapore., pages 496–499, August 2001. M. Charbit Débruitage des signaux audio - 59/60 Introduction Evaluation Suppression des craquements Suppression du bruit de fond Modélisation des signaux Algorithme d’Ephraïm et Malah G. Yu, S. Mallat, and E. Bacry. Audio denoising by time-frequency block thresholding. IEEE Transactions on Signal Processing, 56 :1830–1839, May 2008. E. Zavarehei and S. Vaseghi. Speech enhancement in temporal dft trajectories using kalman filter. Interspeech 2005 Lisbon, 2005. M. Charbit Débruitage des signaux audio - 60/60