Débruitage des signaux audio

Transcription

Débruitage des signaux audio
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Débruitage des signaux audio
M. Charbit
Département du Traitement du Signal et des Images Laboratoire de Transmission
et de Communication de l’Information-UMR5141 GET-Télécom Paris
M. Charbit
Débruitage des signaux audio - 1/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
1
Introduction
2
Evaluation
3
Suppression des craquements
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
4
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
M. Charbit
Débruitage des signaux audio - 2/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Origines
Conditions de la prise de sons, microphones, position du
microphone,
Conditions de propagation : réverbération, effet additif de
réflexions multiples d’un signal acoustique, échos,
propagation à travers un canal,
Bruit d’origine électrique/électronique des dispositifs,
Distorsions non linéaires : écrêtage,
Bruit de quantification introduit par les opérations de
codage/décogage,
Imperfection et/ou détérioration des supports, effacement.
M. Charbit
Débruitage des signaux audio - 3/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Origines
Conditions de la prise de sons, microphones, position du
microphone,
Conditions de propagation : réverbération, effet additif de
réflexions multiples d’un signal acoustique, échos,
propagation à travers un canal,
Bruit d’origine électrique/électronique des dispositifs,
Distorsions non linéaires : écrêtage,
Bruit de quantification introduit par les opérations de
codage/décogage,
Imperfection et/ou détérioration des supports, effacement.
M. Charbit
Débruitage des signaux audio - 3/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Origines
Conditions de la prise de sons, microphones, position du
microphone,
Conditions de propagation : réverbération, effet additif de
réflexions multiples d’un signal acoustique, échos,
propagation à travers un canal,
Bruit d’origine électrique/électronique des dispositifs,
Distorsions non linéaires : écrêtage,
Bruit de quantification introduit par les opérations de
codage/décogage,
Imperfection et/ou détérioration des supports, effacement.
M. Charbit
Débruitage des signaux audio - 3/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Origines
Conditions de la prise de sons, microphones, position du
microphone,
Conditions de propagation : réverbération, effet additif de
réflexions multiples d’un signal acoustique, échos,
propagation à travers un canal,
Bruit d’origine électrique/électronique des dispositifs,
Distorsions non linéaires : écrêtage,
Bruit de quantification introduit par les opérations de
codage/décogage,
Imperfection et/ou détérioration des supports, effacement.
M. Charbit
Débruitage des signaux audio - 3/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Origines
Conditions de la prise de sons, microphones, position du
microphone,
Conditions de propagation : réverbération, effet additif de
réflexions multiples d’un signal acoustique, échos,
propagation à travers un canal,
Bruit d’origine électrique/électronique des dispositifs,
Distorsions non linéaires : écrêtage,
Bruit de quantification introduit par les opérations de
codage/décogage,
Imperfection et/ou détérioration des supports, effacement.
M. Charbit
Débruitage des signaux audio - 3/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Origines
Conditions de la prise de sons, microphones, position du
microphone,
Conditions de propagation : réverbération, effet additif de
réflexions multiples d’un signal acoustique, échos,
propagation à travers un canal,
Bruit d’origine électrique/électronique des dispositifs,
Distorsions non linéaires : écrêtage,
Bruit de quantification introduit par les opérations de
codage/décogage,
Imperfection et/ou détérioration des supports, effacement.
M. Charbit
Débruitage des signaux audio - 3/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Dans la suite on s’intéresse principalement au
Craquement : impulsion de durée brève (quelques
échantillons), d’amplitude aléatoire, apparaissant
en un instant aléatoire,
Bruit de fond : un processus aléatoire “stationnaire” centré.
M. Charbit
Débruitage des signaux audio - 4/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Dans la suite on s’intéresse principalement au
Craquement : impulsion de durée brève (quelques
échantillons), d’amplitude aléatoire, apparaissant
en un instant aléatoire,
Bruit de fond : un processus aléatoire “stationnaire” centré.
M. Charbit
Débruitage des signaux audio - 4/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Objectifs
Les objectifs du débruitage varient en fonction de la demande,
citons par exemple :
Amélioration de l’intelligibilité,
Amélioration de la qualité du son,
Modifications qui conduisent à une amélioration des
performances des systèmes de reconnaissance,
Modifications qui conduisent à une amélioration des
performances des systèmes de codage et/ou de
transmission.
traitement en temps réel/différé,
mono/multicapteurs,
référence de bruit seul ou d’autres formes d’a priori sur le
bruit et/ou le signal utile.
M. Charbit
Débruitage des signaux audio - 5/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Intelligibilité : test phonétique, “mot" isolé cad une suite de
syllabes étant ou non un mot de la langue, phrase
intelligible et phonétiquement équilibrée (avec ou sans
signification),
Qualité : test par évaluation absolue ou test de préférence
relative.
MOS pour Mean Opinion Score
Score
5
4
3
2
1
qualité
Excellent
Good
Fair
Poor
Bad
niveau de distorsion
distorsion imperceptible
perceptible, mais pas gênant
perceptible et un peu gênant
gênant, mais pas excessivement désagréable
très gênant et excessivement désagréable
M. Charbit
Débruitage des signaux audio - 6/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Intelligibilité : test phonétique, “mot" isolé cad une suite de
syllabes étant ou non un mot de la langue, phrase
intelligible et phonétiquement équilibrée (avec ou sans
signification),
Qualité : test par évaluation absolue ou test de préférence
relative.
MOS pour Mean Opinion Score
Score
5
4
3
2
1
qualité
Excellent
Good
Fair
Poor
Bad
niveau de distorsion
distorsion imperceptible
perceptible, mais pas gênant
perceptible et un peu gênant
gênant, mais pas excessivement désagréable
très gênant et excessivement désagréable
M. Charbit
Débruitage des signaux audio - 6/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Intelligibilité : test phonétique, “mot" isolé cad une suite de
syllabes étant ou non un mot de la langue, phrase
intelligible et phonétiquement équilibrée (avec ou sans
signification),
Qualité : test par évaluation absolue ou test de préférence
relative.
MOS pour Mean Opinion Score
Score
5
4
3
2
1
qualité
Excellent
Good
Fair
Poor
Bad
niveau de distorsion
distorsion imperceptible
perceptible, mais pas gênant
perceptible et un peu gênant
gênant, mais pas excessivement désagréable
très gênant et excessivement désagréable
M. Charbit
Débruitage des signaux audio - 6/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Observation d’un craquement
F IGURE: Signal provenant d’un enregistrement sur
disque en vinyle et comportant un craquement.
M. Charbit
Débruitage des signaux audio - 7/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Modèle pour le signal utile
La détection de la présence d’un craquement est liée au fait
qu’une petite partie du signal ne semble pas pouvoir se prédire
à partir de l’ensemble des autres valeurs de la trame.
D’où l’idée d’utiliser un modèle de prédiction
valeur prédite s’écrit alors :
...
linéaire. La
ŝn = α1 sn−1 + · · · + αP sn−P
Mais on hésite à dire que sn = ŝn . D’où l’idée d’introduire un
terme d’écart, ce qui conduit à l’expression :
sn = α1 sn−1 + · · · + αP sn−P + wn
où le terme wn est supposé être un processus aléatoire
stationnaire, blanc, centré et de variance σ 2 .
M. Charbit
Débruitage des signaux audio - 8/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Modèle pour le signal utile
La détection de la présence d’un craquement est liée au fait
qu’une petite partie du signal ne semble pas pouvoir se prédire
à partir de l’ensemble des autres valeurs de la trame.
D’où l’idée d’utiliser un modèle de prédiction
valeur prédite s’écrit alors :
...
linéaire. La
ŝn = α1 sn−1 + · · · + αP sn−P
Mais on hésite à dire que sn = ŝn . D’où l’idée d’introduire un
terme d’écart, ce qui conduit à l’expression :
sn = α1 sn−1 + · · · + αP sn−P + wn
où le terme wn est supposé être un processus aléatoire
stationnaire, blanc, centré et de variance σ 2 .
M. Charbit
Débruitage des signaux audio - 8/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Modèle pour le signal utile
La détection de la présence d’un craquement est liée au fait
qu’une petite partie du signal ne semble pas pouvoir se prédire
à partir de l’ensemble des autres valeurs de la trame.
D’où l’idée d’utiliser un modèle de prédiction
valeur prédite s’écrit alors :
...
linéaire. La
ŝn = α1 sn−1 + · · · + αP sn−P
Mais on hésite à dire que sn = ŝn . D’où l’idée d’introduire un
terme d’écart, ce qui conduit à l’expression :
sn = α1 sn−1 + · · · + αP sn−P + wn
où le terme wn est supposé être un processus aléatoire
stationnaire, blanc, centré et de variance σ 2 .
M. Charbit
Débruitage des signaux audio - 8/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Modèle AR-P
Un tel modèle de signal que nous réécrivons
sn + a1 sn−1 + · · · + aP sn−P = wn
est appelé un processus auto-régressif (AR) d’ordre P.
M. Charbit
Débruitage des signaux audio - 9/60
(1)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Modèle pour les clicks
On suppose que les clicks sont des impulsions localisées en un
point temporel, d’amplitude A et de position n0 aléatoires, ce
que nous notons :
i(n) = Aδ(n − n0 )
M. Charbit
Débruitage des signaux audio - 10/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Hypothèses pour les clicks
les clicks sont peu nombreux. Sur les enregistrements
proposés on a observé moins de 1% de clicks, soit moins
de 4 à 5 clicks sur une fenêtre de 400 points.
la durée des clicks est très petite. Elle va de quelques
dizaines à quelques centaines de µs. Pour un signal
échantillonné à 44100 Hz, cela correspond à un nombre
d’échantillons dégradés qui va de 1 à 10. Lors de
l’opération de restauration, le nombre de points à restaurer
est un paramètre à régler en fonction de la qualité d’écoute
obtenue.
M. Charbit
Débruitage des signaux audio - 11/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Hypothèses pour les clicks
les clicks sont peu nombreux. Sur les enregistrements
proposés on a observé moins de 1% de clicks, soit moins
de 4 à 5 clicks sur une fenêtre de 400 points.
la durée des clicks est très petite. Elle va de quelques
dizaines à quelques centaines de µs. Pour un signal
échantillonné à 44100 Hz, cela correspond à un nombre
d’échantillons dégradés qui va de 1 à 10. Lors de
l’opération de restauration, le nombre de points à restaurer
est un paramètre à régler en fonction de la qualité d’écoute
obtenue.
M. Charbit
Débruitage des signaux audio - 11/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Hypothèses pour les clicks
les clicks sont peu nombreux. Sur les enregistrements
proposés on a observé moins de 1% de clicks, soit moins
de 4 à 5 clicks sur une fenêtre de 400 points.
la durée des clicks est très petite. Elle va de quelques
dizaines à quelques centaines de µs. Pour un signal
échantillonné à 44100 Hz, cela correspond à un nombre
d’échantillons dégradés qui va de 1 à 10. Lors de
l’opération de restauration, le nombre de points à restaurer
est un paramètre à régler en fonction de la qualité d’écoute
obtenue.
M. Charbit
Débruitage des signaux audio - 11/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Hypothèses pour les clicks
les clicks sont peu nombreux. Sur les enregistrements
proposés on a observé moins de 1% de clicks, soit moins
de 4 à 5 clicks sur une fenêtre de 400 points.
la durée des clicks est très petite. Elle va de quelques
dizaines à quelques centaines de µs. Pour un signal
échantillonné à 44100 Hz, cela correspond à un nombre
d’échantillons dégradés qui va de 1 à 10. Lors de
l’opération de restauration, le nombre de points à restaurer
est un paramètre à régler en fonction de la qualité d’écoute
obtenue.
M. Charbit
Débruitage des signaux audio - 11/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des paramètres AR−P
Pour estimer les paramètres σ 2 , a1 ,. . ., aP , on fait comme s’il n’y
avait pas de clicks dans la fenêtre d’analyse. Ceci est justifiée
par le fait que le nombre supposé de clicks est faible dans une
fenêtre.
M. Charbit
Débruitage des signaux audio - 12/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
En principe on doit aussi estimer P. En pratique sa valeur a été
déterminée de façon empirique, entre 20 et 50, en évaluant a
posteriori la qualité d’écoute.
Remarquons que plus P est grand, plus les valeurs prédites
s’ajustent aux observations. Par conséquent une trop grande
valeur de P perd en terme de variabilité du modèle et réduit
donc la capacité à détecter un craquement. On dit que l’on fait
du sur-apprentissage. Inversement une valeur de P petite peut
conduire à détecter un échantillon de signal utile comme un
click.
M. Charbit
Débruitage des signaux audio - 13/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
En principe on doit aussi estimer P. En pratique sa valeur a été
déterminée de façon empirique, entre 20 et 50, en évaluant a
posteriori la qualité d’écoute.
Remarquons que plus P est grand, plus les valeurs prédites
s’ajustent aux observations. Par conséquent une trop grande
valeur de P perd en terme de variabilité du modèle et réduit
donc la capacité à détecter un craquement. On dit que l’on fait
du sur-apprentissage. Inversement une valeur de P petite peut
conduire à détecter un échantillon de signal utile comme un
click.
M. Charbit
Débruitage des signaux audio - 13/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
En principe on doit aussi estimer P. En pratique sa valeur a été
déterminée de façon empirique, entre 20 et 50, en évaluant a
posteriori la qualité d’écoute.
Remarquons que plus P est grand, plus les valeurs prédites
s’ajustent aux observations. Par conséquent une trop grande
valeur de P perd en terme de variabilité du modèle et réduit
donc la capacité à détecter un craquement. On dit que l’on fait
du sur-apprentissage. Inversement une valeur de P petite peut
conduire à détecter un échantillon de signal utile comme un
click.
M. Charbit
Débruitage des signaux audio - 13/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
En principe on doit aussi estimer P. En pratique sa valeur a été
déterminée de façon empirique, entre 20 et 50, en évaluant a
posteriori la qualité d’écoute.
Remarquons que plus P est grand, plus les valeurs prédites
s’ajustent aux observations. Par conséquent une trop grande
valeur de P perd en terme de variabilité du modèle et réduit
donc la capacité à détecter un craquement. On dit que l’on fait
du sur-apprentissage. Inversement une valeur de P petite peut
conduire à détecter un échantillon de signal utile comme un
click.
M. Charbit
Débruitage des signaux audio - 13/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Equations de Yule-Walker
On appelle k-ème coefficient de covariance du processus xn la
quantité
r(k) = E [xc (n + k)xc (n)] ,
avec xc (n) = x(n) − E [xn ]
Pour un modèle AR-P, les équations dites de Yule-Walker
fournissent une relation qui lie les coefficients du modèle avec
les coefficients de covariance. Elles ont pour expression :
R a = −r et σ 2 = r(0) − aT r
M. Charbit
Débruitage des signaux audio - 14/60
(2)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Equations de Yule-Walker
On appelle k-ème coefficient de covariance du processus xn la
quantité
r(k) = E [xc (n + k)xc (n)] ,
avec xc (n) = x(n) − E [xn ]
Pour un modèle AR-P, les équations dites de Yule-Walker
fournissent une relation qui lie les coefficients du modèle avec
les coefficients de covariance. Elles ont pour expression :
R a = −r et σ 2 = r(0) − aT r
M. Charbit
Débruitage des signaux audio - 14/60
(2)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
où R est la matrice de covariance de dimension P qui s’écrit :


r(0)
· · · r(P − 1)


..
..
..
R=

.
.
.
r(P − 1) · · ·
où r = r(1) · · ·
r(0)
T
r(P) et où a = a1 · · ·
M. Charbit
T
aP .
Débruitage des signaux audio - 15/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des covariances
On estime les covariances par les moments empiriques :
r̂N (k) =
N−k
1 X
(xn+k − µ̂N )(xn − µ̂N )
N
n=1
où
N
1X
µ̂N =
xn
N
n=1
En pratique, N doit être choisi le plus grand possible tout en
satisfaisant l’hypothèse de stationnarité.
En parole, par exemple, les durées de stationnarité sont de
l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence
d’échantillonnage Fe = 44.1 kHz, à quelques centaines
d’échantillons.
M. Charbit
Débruitage des signaux audio - 16/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des covariances
On estime les covariances par les moments empiriques :
r̂N (k) =
N−k
1 X
(xn+k − µ̂N )(xn − µ̂N )
N
n=1
où
N
1X
µ̂N =
xn
N
n=1
En pratique, N doit être choisi le plus grand possible tout en
satisfaisant l’hypothèse de stationnarité.
En parole, par exemple, les durées de stationnarité sont de
l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence
d’échantillonnage Fe = 44.1 kHz, à quelques centaines
d’échantillons.
M. Charbit
Débruitage des signaux audio - 16/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des covariances
On estime les covariances par les moments empiriques :
r̂N (k) =
N−k
1 X
(xn+k − µ̂N )(xn − µ̂N )
N
n=1
où
N
1X
µ̂N =
xn
N
n=1
En pratique, N doit être choisi le plus grand possible tout en
satisfaisant l’hypothèse de stationnarité.
En parole, par exemple, les durées de stationnarité sont de
l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence
d’échantillonnage Fe = 44.1 kHz, à quelques centaines
d’échantillons.
M. Charbit
Débruitage des signaux audio - 16/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des covariances
On estime les covariances par les moments empiriques :
r̂N (k) =
N−k
1 X
(xn+k − µ̂N )(xn − µ̂N )
N
n=1
où
N
1X
µ̂N =
xn
N
n=1
En pratique, N doit être choisi le plus grand possible tout en
satisfaisant l’hypothèse de stationnarité.
En parole, par exemple, les durées de stationnarité sont de
l’ordre de 10 à 20 ms, ce qui correspond, pour une fréquence
d’échantillonnage Fe = 44.1 kHz, à quelques centaines
d’échantillons.
M. Charbit
Débruitage des signaux audio - 16/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des paramètres AR−P
Pour estimer les coefficients du modèle, on remplace dans les
équations de Yule-Walker (2) les moments statistiques par les
moments empiriques correspondant. On obtient :
â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂
où R̂ est la matrice de covariance empirique de dimension
P × P et où r̂ = [r̂(1) . . . r̂(P)]T .
On montre que le filtre récursif de réponse en fréquence
1
1 + â1 e−2jπf + · · · + âP e−2jπPf
est causal
P et stable. Ce qui signifie que le polynôme
A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement
à l’intérieur du cercle unité.
M. Charbit
Débruitage des signaux audio - 17/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des paramètres AR−P
Pour estimer les coefficients du modèle, on remplace dans les
équations de Yule-Walker (2) les moments statistiques par les
moments empiriques correspondant. On obtient :
â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂
où R̂ est la matrice de covariance empirique de dimension
P × P et où r̂ = [r̂(1) . . . r̂(P)]T .
On montre que le filtre récursif de réponse en fréquence
1
1 + â1 e−2jπf + · · · + âP e−2jπPf
est causal
P et stable. Ce qui signifie que le polynôme
A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement
à l’intérieur du cercle unité.
M. Charbit
Débruitage des signaux audio - 17/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des paramètres AR−P
Pour estimer les coefficients du modèle, on remplace dans les
équations de Yule-Walker (2) les moments statistiques par les
moments empiriques correspondant. On obtient :
â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂
où R̂ est la matrice de covariance empirique de dimension
P × P et où r̂ = [r̂(1) . . . r̂(P)]T .
On montre que le filtre récursif de réponse en fréquence
1
1 + â1 e−2jπf + · · · + âP e−2jπPf
est causal
P et stable. Ce qui signifie que le polynôme
A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement
à l’intérieur du cercle unité.
M. Charbit
Débruitage des signaux audio - 17/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Estimation des paramètres AR−P
Pour estimer les coefficients du modèle, on remplace dans les
équations de Yule-Walker (2) les moments statistiques par les
moments empiriques correspondant. On obtient :
â = R̂−1 r̂ et σ̂ 2 = r̂(0) − âT r̂
où R̂ est la matrice de covariance empirique de dimension
P × P et où r̂ = [r̂(1) . . . r̂(P)]T .
On montre que le filtre récursif de réponse en fréquence
1
1 + â1 e−2jπf + · · · + âP e−2jπPf
est causal
P et stable. Ce qui signifie que le polynôme
A(z) = k=0 ak z−k (où a0 = 1) a toutes ses racines strictement
à l’intérieur du cercle unité.
M. Charbit
Débruitage des signaux audio - 17/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Test d’hypothèses
Le problème de la détection des clicks peut se formuler comme
un test à deux hypothèses :
(
Hypothèse H0 d’absence de click :
xn = sn
Hypothèse H1 de présence de click : xn = sn + Aδn−n0
L’approche adoptée consiste à effectuer un filtrage linéaire des
observations x1 , · · · , xN , puis de comparer les sorties obtenues
à une seuil. Il est à noter que cette façon de procéder est
optimale si le processus sn est gaussien.
M. Charbit
Débruitage des signaux audio - 18/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Test d’hypothèses
Le problème de la détection des clicks peut se formuler comme
un test à deux hypothèses :
(
Hypothèse H0 d’absence de click :
xn = sn
Hypothèse H1 de présence de click : xn = sn + Aδn−n0
L’approche adoptée consiste à effectuer un filtrage linéaire des
observations x1 , · · · , xN , puis de comparer les sorties obtenues
à une seuil. Il est à noter que cette façon de procéder est
optimale si le processus sn est gaussien.
M. Charbit
Débruitage des signaux audio - 18/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Test d’hypothèses
Le problème de la détection des clicks peut se formuler comme
un test à deux hypothèses :
(
Hypothèse H0 d’absence de click :
xn = sn
Hypothèse H1 de présence de click : xn = sn + Aδn−n0
L’approche adoptée consiste à effectuer un filtrage linéaire des
observations x1 , · · · , xN , puis de comparer les sorties obtenues
à une seuil. Il est à noter que cette façon de procéder est
optimale si le processus sn est gaussien.
M. Charbit
Débruitage des signaux audio - 18/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
On applique, tout d’abord, le filtre de blanchiment de fonction
de transfert A(z) associé au modèle AR d’ordre P. Le problème
précédent est équivalent au test suivant :
(
Hypothèse H0 d’absence de click :
yn = wn
Hypothèse H1 de présence de click : yn = wn + Aan−n0
où wn est un bruit blanc.
On est donc ramené au problème de la détection d’une
impulsion de forme connue a(n) dans un bruit blanc. La solution
est fournie par le filtre adapté de réponse impulsionnelle a(−n)
suivi d’un détecteur qui compare le module du signal de sortie
du filtre à un seuil.
M. Charbit
Débruitage des signaux audio - 19/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
On applique, tout d’abord, le filtre de blanchiment de fonction
de transfert A(z) associé au modèle AR d’ordre P. Le problème
précédent est équivalent au test suivant :
(
Hypothèse H0 d’absence de click :
yn = wn
Hypothèse H1 de présence de click : yn = wn + Aan−n0
où wn est un bruit blanc.
On est donc ramené au problème de la détection d’une
impulsion de forme connue a(n) dans un bruit blanc. La solution
est fournie par le filtre adapté de réponse impulsionnelle a(−n)
suivi d’un détecteur qui compare le module du signal de sortie
du filtre à un seuil.
M. Charbit
Débruitage des signaux audio - 19/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
On applique, tout d’abord, le filtre de blanchiment de fonction
de transfert A(z) associé au modèle AR d’ordre P. Le problème
précédent est équivalent au test suivant :
(
Hypothèse H0 d’absence de click :
yn = wn
Hypothèse H1 de présence de click : yn = wn + Aan−n0
où wn est un bruit blanc.
On est donc ramené au problème de la détection d’une
impulsion de forme connue a(n) dans un bruit blanc. La solution
est fournie par le filtre adapté de réponse impulsionnelle a(−n)
suivi d’un détecteur qui compare le module du signal de sortie
du filtre à un seuil.
M. Charbit
Débruitage des signaux audio - 19/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Détection des craquements
En conclusion on a le traitement représenté figure 2 suivi d’un
détecteur à seuil.
F IGURE: Détection des craquements. Le détecteur
compare le module du signal en sortie du filtre à un
seuil.
M. Charbit
Débruitage des signaux audio - 20/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Détermination du seuil
Sous l’hypothèse gaussienne, le seuil de décision η qui
correspond à une probabilité de fausse alarme égale à α est
donné par :
q
η = λ(α) σ
1 + a21 + · · · + a2P
où α 7→ λ vérifie :
Z
+∞
λ
1
2
√ e−t /2 dt = α/2
2π
On a λ(0.05) = 1.96.
M. Charbit
Débruitage des signaux audio - 21/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
F IGURE: Restauration
Montrons qu’une approche des moindres carrés conduit à
l’expression suivante de l’estimateur :
b
y = −(BT B)−1 BT (A0 x0 + A1 x1 )
M. Charbit
Débruitage des signaux audio - 22/60
(3)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Le problème est de minimiser
N
P
X
X
(xt +
ak xt−k )2
t=1
k=1
par rapport à (x` , . . . , x`+m−1 ) . . .
minimiser :
T
E E=
`+m+P−1
X
e2t
où et =
ce qui est équivalent à
P
X
ak xt−k
avec a0 = 1
k=0
t=`
M. Charbit
Débruitage des signaux audio - 23/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Le problème est de minimiser
N
P
X
X
(xt +
ak xt−k )2
t=1
k=1
par rapport à (x` , . . . , x`+m−1 ) . . . ce qui est équivalent à
minimiser :
T
E E=
`+m+P−1
X
e2t
où et =
P
X
ak xt−k
avec a0 = 1
k=0
t=`
M. Charbit
Débruitage des signaux audio - 23/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Sous forme matricielle E s’écrit

aP aP−1 · · ·
a0
0
0
a
a
·
·
·
a
P
P−1
0

E = .
.
.
.
.
.
0
···
0
aP
···
0
aP−1 · · ·

···  
x0
· · ·
 
 y =A
0 x
1
a0
 
x0
y
x1
où A est une matrice de dimension (m + P) × (m + 2P) et où
T
T
y = (x` · · · x`+m−1 ) , x0 = (x`−P · · · x`−1 ) et
T
x1 = (x`+m · · · x`+m+P ) .
M. Charbit
Débruitage des signaux audio - 24/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Sous forme bloc-matrice E s’écrit encore :
 
x0
E = A0 B A1  y  = A0 x0 + A1 x1 + By
x1
Le problème revient à déterminer y qui minimise la norme de E
pour le modèle linéaire :
A0 x0 + A1 x1 = −By + E
la solution est donnée par :
b
y = −(BT B)−1 BT (A0 x0 + A1 x1 )
M. Charbit
Débruitage des signaux audio - 25/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
Sous forme bloc-matrice E s’écrit encore :
 
x0
E = A0 B A1  y  = A0 x0 + A1 x1 + By
x1
Le problème revient à déterminer y qui minimise la norme de E
pour le modèle linéaire :
A0 x0 + A1 x1 = −By + E
la solution est donnée par :
b
y = −(BT B)−1 BT (A0 x0 + A1 x1 )
M. Charbit
Débruitage des signaux audio - 25/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Détection des craquements
Restauration des valeurs
Résultats
F IGURE: Craquement (trait bleu en pointillé), signal
restauré (trait rouge).
M. Charbit
Débruitage des signaux audio - 26/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Suppression du bruit de fond
On ne dispose que d’une seule copie de l’enregistrement,
ce qui condamne les méthodes de type multicapteurs,
On dispose d’une référence de bruit, ce qui permet
d’estimer ses propriétés spectrales.
Principe : analyse spectrale à court-terme (en anglais STSA
pour Short Term Spectral Analysis)
M. Charbit
Débruitage des signaux audio - 27/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Suppression du bruit de fond
On ne dispose que d’une seule copie de l’enregistrement,
ce qui condamne les méthodes de type multicapteurs,
On dispose d’une référence de bruit, ce qui permet
d’estimer ses propriétés spectrales.
Principe : analyse spectrale à court-terme (en anglais STSA
pour Short Term Spectral Analysis)
M. Charbit
Débruitage des signaux audio - 27/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Suppression du bruit de fond
On ne dispose que d’une seule copie de l’enregistrement,
ce qui condamne les méthodes de type multicapteurs,
On dispose d’une référence de bruit, ce qui permet
d’estimer ses propriétés spectrales.
Principe : analyse spectrale à court-terme (en anglais STSA
pour Short Term Spectral Analysis)
M. Charbit
Débruitage des signaux audio - 27/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Modèle de signal
Les signaux sont échantillonnés à la fréquence Fe . On note
xn = sn + bn pour n ∈ {0, · · · , N − 1}
(4)
les signaux observés.
On suppose que bn est un processus aléatoire stationnaire au
second ordre, gaussien, centré. On note γB (f ) sa densité
spectrale.
M. Charbit
Débruitage des signaux audio - 28/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Modèle de signal
Les signaux sont échantillonnés à la fréquence Fe . On note
xn = sn + bn pour n ∈ {0, · · · , N − 1}
(4)
les signaux observés.
On suppose que bn est un processus aléatoire stationnaire au
second ordre, gaussien, centré. On note γB (f ) sa densité
spectrale.
M. Charbit
Débruitage des signaux audio - 28/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Analyse spectrale à court-terme (Short-Time Spectral
Analysis
Le signal est segmenté en trames de longueur N avec un
recouvrement de P points.
On note (x(`(N − P), · · · , x(`(N − P) + N − 1) la `-ème trame. La
transformée de Fourier discrète s’écrit :
X(`, k) =
N−1
X
wN (n)x(`(N − P) + n)e−2jπkn/N
n=0
où k = 0 · · · N − 1 et où wN désigne une fenêtre de pondération
(typiquement
rectangulaire, Hamming ou Hann) vérifiant
P 2
−1/2 .
n wN (n) = 1. Pour la fenêtre rectangulaire wN (n) = N
M. Charbit
Débruitage des signaux audio - 29/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Analyse spectrale à court-terme (Short-Time Spectral
Analysis
Le signal est segmenté en trames de longueur N avec un
recouvrement de P points.
On note (x(`(N − P), · · · , x(`(N − P) + N − 1) la `-ème trame. La
transformée de Fourier discrète s’écrit :
X(`, k) =
N−1
X
wN (n)x(`(N − P) + n)e−2jπkn/N
n=0
où k = 0 · · · N − 1 et où wN désigne une fenêtre de pondération
(typiquement
rectangulaire, Hamming ou Hann) vérifiant
P 2
−1/2 .
n wN (n) = 1. Pour la fenêtre rectangulaire wN (n) = N
M. Charbit
Débruitage des signaux audio - 29/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Modèles de signal
Par linéarité de la TFD, on a
Xk = Sk + Bk
où Sk et Bk désignent respectivement les STSA de sn et bn .
N correspond en parole à une durée de stationnarité de 20
à 40 ms. Soit N de l’ordre de quelques centaines à
Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est
de l’ordre de quelques dizaines de Hz.
P:
le recouvrement conseillé est typiquement de 50% à 75%.
On distingue principalement :
le spectre d’amplitude : |Xk |,
le spectre de puissance ou périodogramme : N −1 |Xk |2
M. Charbit
Débruitage des signaux audio - 30/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Modèles de signal
Par linéarité de la TFD, on a
Xk = Sk + Bk
où Sk et Bk désignent respectivement les STSA de sn et bn .
N correspond en parole à une durée de stationnarité de 20
à 40 ms. Soit N de l’ordre de quelques centaines à
Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est
de l’ordre de quelques dizaines de Hz.
P:
le recouvrement conseillé est typiquement de 50% à 75%.
On distingue principalement :
le spectre d’amplitude : |Xk |,
le spectre de puissance ou périodogramme : N −1 |Xk |2
M. Charbit
Débruitage des signaux audio - 30/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Modèles de signal
Par linéarité de la TFD, on a
Xk = Sk + Bk
où Sk et Bk désignent respectivement les STSA de sn et bn .
N correspond en parole à une durée de stationnarité de 20
à 40 ms. Soit N de l’ordre de quelques centaines à
Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est
de l’ordre de quelques dizaines de Hz.
P:
le recouvrement conseillé est typiquement de 50% à 75%.
On distingue principalement :
le spectre d’amplitude : |Xk |,
le spectre de puissance ou périodogramme : N −1 |Xk |2
M. Charbit
Débruitage des signaux audio - 30/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Modèles de signal
Par linéarité de la TFD, on a
Xk = Sk + Bk
où Sk et Bk désignent respectivement les STSA de sn et bn .
N correspond en parole à une durée de stationnarité de 20
à 40 ms. Soit N de l’ordre de quelques centaines à
Fe = 44.1 kHz. Il s’ensuit que la résolution en fréquence est
de l’ordre de quelques dizaines de Hz.
P:
le recouvrement conseillé est typiquement de 50% à 75%.
On distingue principalement :
le spectre d’amplitude : |Xk |,
le spectre de puissance ou périodogramme : N −1 |Xk |2
M. Charbit
Débruitage des signaux audio - 30/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Evaluations
On effectue en général un traitement en fréquence cad . . . un
filtrage linéaire de gain en fréquence H(f ).
Pour évaluer les performances on considère :
R
E |sn |2
Ss (f )df
=R
SNRi :
E [|bn |2 ]
Sb (f )df
R
E |ŝn |2
|H(f )|2 Ss (f )df
R
h
i
SNRo :
=
|H(f )|2 Sb (f )df
E |b̂n |2
R
E |sn − ŝn |2
|1 − H(f )|2 Ss (f )df
R
=
DI :
E [|ŝn |2 ]
Ss (f )df
M. Charbit
Débruitage des signaux audio - 31/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Evaluations
On effectue en général un traitement en fréquence cad . . . un
filtrage linéaire de gain en fréquence H(f ).
Pour évaluer les performances on considère :
R
E |sn |2
Ss (f )df
SNRi :
=R
E [|bn |2 ]
Sb (f )df
R
E |ŝn |2
|H(f )|2 Ss (f )df
R
h
i
SNRo :
=
|H(f )|2 Sb (f )df
E |b̂n |2
R
E |sn − ŝn |2
|1 − H(f )|2 Ss (f )df
R
=
DI :
E [|ŝn |2 ]
Ss (f )df
M. Charbit
Débruitage des signaux audio - 31/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Evaluations
On effectue en général un traitement en fréquence cad . . . un
filtrage linéaire de gain en fréquence H(f ).
Pour évaluer les performances on considère :
R
E |sn |2
Ss (f )df
SNRi :
=R
E [|bn |2 ]
Sb (f )df
R
E |ŝn |2
|H(f )|2 Ss (f )df
R
h
i
SNRo :
=
|H(f )|2 Sb (f )df
E |b̂n |2
R
E |sn − ŝn |2
|1 − H(f )|2 Ss (f )df
R
=
DI :
E [|ŝn |2 ]
Ss (f )df
M. Charbit
Débruitage des signaux audio - 31/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Evaluations
On effectue en général un traitement en fréquence cad . . . un
filtrage linéaire de gain en fréquence H(f ).
Pour évaluer les performances on considère :
R
E |sn |2
Ss (f )df
SNRi :
=R
E [|bn |2 ]
Sb (f )df
R
E |ŝn |2
|H(f )|2 Ss (f )df
R
h
i
SNRo :
=
|H(f )|2 Sb (f )df
E |b̂n |2
R
E |sn − ŝn |2
|1 − H(f )|2 Ss (f )df
R
=
DI :
E [|ŝn |2 ]
Ss (f )df
M. Charbit
Débruitage des signaux audio - 31/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Expressions en fréquence
On suppose que les composantes Sk et Bk sont gaussiennes
complexes, centrées,
indépendantes,
de 2covariances
2
2
2
respectives σS = E |Sk | et σB = E |Bk | . Il s’ensuit que
E |Xk |2 = E |Sk |2 + E |Bk |2 ,
M. Charbit
et E [Xk∗ Sk ] = E |Sk |2
Débruitage des signaux audio - 32/60
(5)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Expressions en fréquence
On suppose que les composantes Sk et Bk sont gaussiennes
complexes, centrées,
indépendantes,
de 2covariances
2
2
2
respectives σS = E |Sk | et σB = E |Bk | . Il s’ensuit que
E |Xk |2 = E |Sk |2 + E |Bk |2 ,
M. Charbit
et E [Xk∗ Sk ] = E |Sk |2
Débruitage des signaux audio - 32/60
(5)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
On suppose que l’on effectue un traitement linéaire de la forme
Ŝk = gk Xk
On cherche les gains en fréquence gk qui minimisent l’écart
quadratique défini par :
J(gk ) = E |Sk − gk Xk |2
M. Charbit
Débruitage des signaux audio - 33/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
On suppose que l’on effectue un traitement linéaire de la forme
Ŝk = gk Xk
On cherche les gains en fréquence gk qui minimisent l’écart
quadratique défini par :
J(gk ) = E |Sk − gk Xk |2
M. Charbit
Débruitage des signaux audio - 33/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
En annulant la dérivée par rapport à gk il vient :
E [Xk∗ (Sk − gk Xk )] = 0
Il s’ensuit que le gain, qui minimise le risque à la fréquence k, a
pour expression :
gk =
E [Xk∗ Sk ]
E [|Xk |2 ]
qui porte le nom de filtrage de Wiener.
M. Charbit
Débruitage des signaux audio - 34/60
(6)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustraction spectrale
En utilisant (5), on obtient :
E |Bk |2
E |Sk |2
=1−
(7)
gk =
E [|Xk |2 ]
E [|Xk |2 ]
En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces
espérances peuvent être estimées
de la façon suivante :
une approximation de E |Bk |2 est donnée par une
estimation de la densité spectrale au point de fréquence
kFe /N.
une approximation de E |Xk |2 est donnée |Xk |2 .
Finalement on a :
gk ≈ 1 −
M. Charbit
γ̂B (k)
|Xk |2
Débruitage des signaux audio - 35/60
(8)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustraction spectrale
En utilisant (5), on obtient :
E |Bk |2
E |Sk |2
=1−
(7)
gk =
E [|Xk |2 ]
E [|Xk |2 ]
En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces
espérances peuvent être estimées
de la façon suivante :
une approximation de E |Bk |2 est donnée par une
estimation de la densité spectrale au point de fréquence
kFe /N.
une approximation de E |Xk |2 est donnée |Xk |2 .
Finalement on a :
gk ≈ 1 −
M. Charbit
γ̂B (k)
|Xk |2
Débruitage des signaux audio - 35/60
(8)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustraction spectrale
En utilisant (5), on obtient :
E |Bk |2
E |Sk |2
=1−
(7)
gk =
E [|Xk |2 ]
E [|Xk |2 ]
En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces
espérances peuvent être estimées
de la façon suivante :
une approximation de E |Bk |2 est donnée par une
estimation de la densité spectrale au point de fréquence
kFe /N.
une approximation de E |Xk |2 est donnée |Xk |2 .
Finalement on a :
gk ≈ 1 −
M. Charbit
γ̂B (k)
|Xk |2
Débruitage des signaux audio - 35/60
(8)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustraction spectrale
En utilisant (5), on obtient :
E |Bk |2
E |Sk |2
=1−
(7)
gk =
E [|Xk |2 ]
E [|Xk |2 ]
En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces
espérances peuvent être estimées
de la façon suivante :
une approximation de E |Bk |2 est donnée par une
estimation de la densité spectrale au point de fréquence
kFe /N.
une approximation de E |Xk |2 est donnée |Xk |2 .
Finalement on a :
gk ≈ 1 −
M. Charbit
γ̂B (k)
|Xk |2
Débruitage des signaux audio - 35/60
(8)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustraction spectrale
En utilisant (5), on obtient :
E |Bk |2
E |Sk |2
=1−
(7)
gk =
E [|Xk |2 ]
E [|Xk |2 ]
En pratique ni E |Bk |2 ni E |Xk |2 ne sont observables. Ces
espérances peuvent être estimées
de la façon suivante :
une approximation de E |Bk |2 est donnée par une
estimation de la densité spectrale au point de fréquence
kFe /N.
une approximation de E |Xk |2 est donnée |Xk |2 .
Finalement on a :
gk ≈ 1 −
M. Charbit
γ̂B (k)
|Xk |2
Débruitage des signaux audio - 35/60
(8)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Bruit musical
Du fait de la grande variance du périodogramme (cad |Xk |2 , on
a tendance à accentuer de façon aléatoire, d’une trame à
l’autre, le gain et donc les composantes du bruit
correspondantes, ce qui produit un sifflement peu naturel
désigné sous le nom de bruit musical.
M. Charbit
Débruitage des signaux audio - 36/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Bruit musical
Du fait de la grande variance du périodogramme (cad |Xk |2 , on
a tendance à accentuer de façon aléatoire, d’une trame à
l’autre, le gain et donc les composantes du bruit
correspondantes, ce qui produit un sifflement peu naturel
désigné sous le nom de bruit musical.
M. Charbit
Débruitage des signaux audio - 36/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Pour réduire le bruit musical on peut
sur-estimer le niveau du bruit. C’est le rôle du paramètre λ
dans l’expression (9).
forcer le gain à une valeur plancher lorsque le rapport
signal sur bruit passe en dessous d’un certain seuil. C’est
le rôle du paramètre η dans l’expression (9).
On peut aussi effectuer une moyenne sur les
périodogrammes sur plusieurs trames adjacentes.
M. Charbit
Débruitage des signaux audio - 37/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustractions spectrales proposées
Des variantes de la soustraction spectrale ont été proposées
par la suite. En particulier on a considéré des gains en
fréquence de la forme Ŝk = gk Xk avec
)
(
(|Xk |α − λµ̂B,α (k))1/α
1/α
, η µ̂B,α (k)
(9)
gk = max
|Xk |
µ̂B,α est estimé par une analyse spectrale à cour-terme,
M. Charbit
Débruitage des signaux audio - 38/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Soustractions spectrales proposées
Des variantes de la soustraction spectrale ont été proposées
par la suite. En particulier on a considéré des gains en
fréquence de la forme Ŝk = gk Xk avec
)
(
(|Xk |α − λµ̂B,α (k))1/α
1/α
, η µ̂B,α (k)
(9)
gk = max
|Xk |
µ̂B,α est estimé par une analyse spectrale à cour-terme,
M. Charbit
Débruitage des signaux audio - 38/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
λ > 1. L’augmentation du coefficient λ réduit le bruit
résiduel, mais peut introduire une distorsion du signal si sa
valeur est trop élevée, en particulier si la puissance du
bruit est constante tandis que la puissance du signal utile
varie d’une trame à l’autre. D’où l’idée de faire varier λ
d’une trame à l’autre en le choisissant d’autant plus petit
que le rapport signal sur bruit est grand.
où α > 0, typiquement α = 1 ou α = 2,
0 ≤ η 1. Il est conseillé de prendre pour η des valeurs
comprises entre 0.005 et 0.1.
M. Charbit
Débruitage des signaux audio - 39/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
λ > 1. L’augmentation du coefficient λ réduit le bruit
résiduel, mais peut introduire une distorsion du signal si sa
valeur est trop élevée, en particulier si la puissance du
bruit est constante tandis que la puissance du signal utile
varie d’une trame à l’autre. D’où l’idée de faire varier λ
d’une trame à l’autre en le choisissant d’autant plus petit
que le rapport signal sur bruit est grand.
où α > 0, typiquement α = 1 ou α = 2,
0 ≤ η 1. Il est conseillé de prendre pour η des valeurs
comprises entre 0.005 et 0.1.
M. Charbit
Débruitage des signaux audio - 39/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
MMSE : Ephraïm et Malah
On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est
gaussien, on en déduit que
pUk Φk (uk , φk ) =
uk
2
2
e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π))
2
πσS (k)
qui montre que les variables aléatoires Uk et Φk sont
indépendantes.
On pose
Xk = Sk + Bk = Vk eiΘk
De l’hypothèse d’indépendance de Sk et Bk , on déduit que
1
1
jφk 2
pXk |Uk ,Φk (xk , uk , φk ) =
exp − 2 |xk − uk e |
πσB2 (k)
σB (k)
M. Charbit
Débruitage des signaux audio - 40/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
MMSE : Ephraïm et Malah
On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est
gaussien, on en déduit que
pUk Φk (uk , φk ) =
uk
2
2
e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π))
2
πσS (k)
qui montre que les variables aléatoires Uk et Φk sont
indépendantes.
On pose
Xk = Sk + Bk = Vk eiΘk
De l’hypothèse d’indépendance de Sk et Bk , on déduit que
1
1
jφk 2
pXk |Uk ,Φk (xk , uk , φk ) =
exp − 2 |xk − uk e |
πσB2 (k)
σB (k)
M. Charbit
Débruitage des signaux audio - 40/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
MMSE : Ephraïm et Malah
On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est
gaussien, on en déduit que
pUk Φk (uk , φk ) =
uk
2
2
e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π))
2
πσS (k)
qui montre que les variables aléatoires Uk et Φk sont
indépendantes.
On pose
Xk = Sk + Bk = Vk eiΘk
De l’hypothèse d’indépendance de Sk et Bk , on déduit que
1
1
jφk 2
pXk |Uk ,Φk (xk , uk , φk ) =
exp − 2 |xk − uk e |
πσB2 (k)
σB (k)
M. Charbit
Débruitage des signaux audio - 40/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
MMSE : Ephraïm et Malah
On pose Sk = Uk eiΦk . En utilisant l’hypothèse que Xk est
gaussien, on en déduit que
pUk Φk (uk , φk ) =
uk
2
2
e−uk /σS (k) 1 (uk ≥ 0) 1 (φk ∈ (0, 2π))
2
πσS (k)
qui montre que les variables aléatoires Uk et Φk sont
indépendantes.
On pose
Xk = Sk + Bk = Vk eiΘk
De l’hypothèse d’indépendance de Sk et Bk , on déduit que
1
1
jφk 2
pXk |Uk ,Φk (xk , uk , φk ) =
exp − 2 |xk − uk e |
πσB2 (k)
σB (k)
M. Charbit
Débruitage des signaux audio - 40/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
La loi conjointe de (Uk , Vk ) s’obtient en intégrant sur φ et θ, ce
qui donne :
u2
pUk Vk (uk , vk ) =
v2 +u2
− 2k
− k2 k
4uk vk
σ (k)
σB (k)
S
e
e
I0
σS2 (k)σB2 (k)
2uk vk
σB2 (k)
1 (uk ≥ 0, vk ≥ 0)
et donc
v2 +u2
2vk − k2 k
pVk |Uk (uk , vk ) = 2 e σB (k) I0
σB (k)
M. Charbit
2uk vk
σB2 (k)
1 (uk ≥ 0, vk ≥ 0)
Débruitage des signaux audio - 41/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
F IGURE: Densité de probabilité de β = Vk2 /σB2 (k)
(échelle en dB) sachant α = Uk2 /σB2 (k) pour
α = {0, 4, 8, 12, 16} dB.
M. Charbit
Débruitage des signaux audio - 42/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
La “meilleure” estimation de Uk sachant Xk est donnée par
E [Uk |Xk ]. Le calcul montre que
Ûk = E [Uk |Xk ] = gk Vk
On rappelle que
E Vk2 = E Uk2 + E |Bk |2
M. Charbit
Débruitage des signaux audio - 43/60
(10)
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
où
√
√
π ξk
gk =
exp(−νk /2) νk
2 1 + ξk
1
1+ √
I0 (νk /2) + I1 (νk /2)
νk
(11)
avec
E Uk2
ξk = 2
σB (k)
Vk2
σB2 (k)
ξk
νk =
ζk
1 + ξk
λk = (ζk − 1)
ζk =
M. Charbit
RSBPRIO
RSBPOST
RSBINST
Débruitage des signaux audio - 44/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
où
√
√
π ξk
gk =
exp(−νk /2) νk
2 1 + ξk
1
1+ √
I0 (νk /2) + I1 (νk /2)
νk
(11)
avec
E Uk2
ξk = 2
σB (k)
Vk2
σB2 (k)
ξk
νk =
ζk
1 + ξk
λk = (ζk − 1)
ζk =
M. Charbit
RSBPRIO
RSBPOST
RSBINST
Débruitage des signaux audio - 44/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
où
√
√
π ξk
gk =
exp(−νk /2) νk
2 1 + ξk
1
1+ √
I0 (νk /2) + I1 (νk /2)
νk
(11)
avec
E Uk2
ξk = 2
σB (k)
Vk2
σB2 (k)
ξk
νk =
ζk
1 + ξk
λk = (ζk − 1)
ζk =
M. Charbit
RSBPRIO
RSBPOST
RSBINST
Débruitage des signaux audio - 44/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
où
√
√
π ξk
gk =
exp(−νk /2) νk
2 1 + ξk
1
1+ √
I0 (νk /2) + I1 (νk /2)
νk
(11)
avec
E Uk2
ξk = 2
σB (k)
Vk2
σB2 (k)
ξk
νk =
ζk
1 + ξk
λk = (ζk − 1)
ζk =
M. Charbit
RSBPRIO
RSBPOST
RSBINST
Débruitage des signaux audio - 44/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
RSBPRIO
F IGURE: Gain d’Ephraïm et Malah en fonction du
RSB a priori ξk et du RSB instantané λk .
M. Charbit
Débruitage des signaux audio - 45/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Dans ce cas où le RSBPRIO est faible, l’atténuation est
importante même si le RSBINST est grand.
Cette correction a quelque chose qui peut paraître non intuitif
dans la mesure, où quand le RSBINST est grand, on pourrait
penser qu’il faut une atténuation faible. Cependant c’est
précisément ce comportement qui réduit le bruit musical. Il
s’ensuit, en effet, que les grandes valeurs du spectre, lorsque
le RSBPRIO est faible, sont “tirées" vers le bas.
Par ce moyen, l’algorithme évite l’apparition de “paquets” de
raies si jamais le bruit venait à excéder ses caractéristiques
moyennes. N’oublions pas qu’un bruit gaussien excède sa
moyenne avec une probabilité 1/2. D’où l’idée éventuellement,
de “sur-estimer” légèrement le niveau moyen du bruit.
M. Charbit
Débruitage des signaux audio - 46/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Dans ce cas où le RSBPRIO est faible, l’atténuation est
importante même si le RSBINST est grand.
Cette correction a quelque chose qui peut paraître non intuitif
dans la mesure, où quand le RSBINST est grand, on pourrait
penser qu’il faut une atténuation faible. Cependant c’est
précisément ce comportement qui réduit le bruit musical. Il
s’ensuit, en effet, que les grandes valeurs du spectre, lorsque
le RSBPRIO est faible, sont “tirées" vers le bas.
Par ce moyen, l’algorithme évite l’apparition de “paquets” de
raies si jamais le bruit venait à excéder ses caractéristiques
moyennes. N’oublions pas qu’un bruit gaussien excède sa
moyenne avec une probabilité 1/2. D’où l’idée éventuellement,
de “sur-estimer” légèrement le niveau moyen du bruit.
M. Charbit
Débruitage des signaux audio - 46/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Dans ce cas où le RSBPRIO est faible, l’atténuation est
importante même si le RSBINST est grand.
Cette correction a quelque chose qui peut paraître non intuitif
dans la mesure, où quand le RSBINST est grand, on pourrait
penser qu’il faut une atténuation faible. Cependant c’est
précisément ce comportement qui réduit le bruit musical. Il
s’ensuit, en effet, que les grandes valeurs du spectre, lorsque
le RSBPRIO est faible, sont “tirées" vers le bas.
Par ce moyen, l’algorithme évite l’apparition de “paquets” de
raies si jamais le bruit venait à excéder ses caractéristiques
moyennes. N’oublions pas qu’un bruit gaussien excède sa
moyenne avec une probabilité 1/2. D’où l’idée éventuellement,
de “sur-estimer” légèrement le niveau moyen du bruit.
M. Charbit
Débruitage des signaux audio - 46/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Estimation du RSBPRIO
D’après les définitions précédentes, on a à la fois :
E Uk2
et ξk = E [ζk − 1]
ξk = 2
σB (k)
Ephraïm et Malah en déduisent l’algorithme adaptatif suivant :
2
2 (t − 1)V 2 (t − 1)
V
(t)
g
k
k
k
+ (1 − α)P
−1
(12)
ξˆk (t) = α
σB2 (k)
σB2 (k)
où P(x) = x1 (x ≥ 0).
M. Charbit
Débruitage des signaux audio - 47/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Estimation du RSBPRIO
D’après les définitions précédentes, on a à la fois :
E Uk2
et ξk = E [ζk − 1]
ξk = 2
σB (k)
Ephraïm et Malah en déduisent l’algorithme adaptatif suivant :
2
2 (t − 1)V 2 (t − 1)
g
V
(t)
k
k
k
ξˆk (t) = α
+ (1 − α)P
−1
(12)
σB2 (k)
σB2 (k)
où P(x) = x1 (x ≥ 0).
M. Charbit
Débruitage des signaux audio - 47/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Tarun Agarwal.
Pre-Processing of Noisy Speech for Voice Coders.
PhD thesis, Department of Electrical and Computer
Engineering, McGill University, Montreal, Canada, 2002.
M. Berouti, R. Schwartz, and J. Makhoul.
Enhancement of speech corrupted by acoustic noise.
Proceedings of the IEEE ICASSP’79, Washington, 1979,
pages 208–211, 1979.
S.F. Boll.
Suppression of acoustic noise in speech using spectral
substraction.
IEEE Trans. on ASSP, pages 113–120, Apr. 1979.
M. Charbit
Débruitage des signaux audio - 48/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
S. Canazza, G. de Poli, S. Maesano, and G. Mian.
On the performance of a noise reduction technique based
on a psychoacoustic model for restoration of old audio
recordings.
Proc. of the COST G-6 Conference on DAFX, Dec. 2000.
O. Cappé.
Elimination of musical noise phenomenon with the Ephraim
and Malah noise suppressor.
IEEE ASSP 2(2), pages 345–349, Apr. 1994.
M. Charbit and O. Cappé.
Restauration d’enregistrements sonores anciens : du
traitement du signal aux applications grand public.
REE. Revue de l’électricité et de l’électronique, pages
40–43, 1997.
M. Charbit
Débruitage des signaux audio - 49/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
I. Cohen.
Noise spectrum estimation in adverse environments :
Improved minima controlled recursive averaging.
IEEE Transactions on Speech and Audio Processing, 10,
2002.
I. Cohen.
On the decision-directed estimation approach of ephraim
and malah.
ICASSP, pages 293–296, 2004.
I. Cohen.
Speech enhancement using a noncausal a priori snr
estimator.
IEEE Signal Processing Letters, Vol. 11, No. 9, pages
725–728, September 2004.
M. Charbit
Débruitage des signaux audio - 50/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Y. Ephraim and D. Malah.
Speech enhancement using a MMSE short-time spectral
amplitude estimator.
IEEE ASSP-32, pages 1109–1121, Dec 1984.
Y. Ephraim and D. Malah.
Speech enhancement using a MMSE error log-spectral
amplitude estimator.
IEEE ASSP-33, pages 443–445, Apr 1985.
Y. Ephraim and D. Malah.
Noisy speech enhancement using discrete cosine
transform.
Speech Communication, 24 :249–257, 1998.
M. Charbit
Débruitage des signaux audio - 51/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
Y. Ephraim and H. Van Trees.
A signal subspace approach for speech enhancement.
IEEE Transactions on Speech and Audio Processing, vol.
3, pages 251–266, 1995.
E.Zavarehei, S. Vaseghi, and Q. Yan.
Speech enhancement using kalman filters for restauration
of short-time dft trajectories.
Automatic Speech Recognition and Understanding (ASRU)
2005 IEEE Workshop Vol. 27, pages 219 – 224, November
2005.
S. Godsill and P. Rayner.
Digital audio restoration.
Springer-verlag, 1998.
M. Charbit
Débruitage des signaux audio - 52/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
T. Gülzow, A. Engelsberg, and U. Heute.
Comparaison of a discret wavelet transform and a non
uniform polyphase filterbank applied to spectral-subtraction
speech enhancement.
SP-64, pages 5–19, 1998.
F. Jabloun and B. Champagne.
Incorporating the human hearing properties in the signal
subspace approach for speech enhancement.
EEE Trans Speech and Audio Processing, 11 :700–708,
2003.
M. Charbit
Débruitage des signaux audio - 53/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
S. H. Jensen, P. C. Hansen, S. D. Hansen, and J. A.
Sorensen.
Reduction of broad-band noise in speech by truncated
qsvd.
IEEE Transactions on Speech and Audio Processing, vol.
3, pages 439–448, 1995.
H. Lev-Ari and Y. Ephraim.
Extension of the signal subspace speech enhancement
approach to colored noise.
IEEE Signal Processing Letters, 10 :104–106, 2003.
M. Charbit
Débruitage des signaux audio - 54/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
R. Martin.
Speech enhancement based on minimum mean-square
error estimation and supergaussian priors.
EEE Trans Speech and Audio Processing, 13 :845–856,
2005.
R. Martin.
Statistical Methods for the Enhancement of Noisy Speech.
Springer-Verlag, 2006.
R. Martin and R. Cox.
New speech enhancement techniques for low bit rate
speech coding.
Proc IEEE Wkshp on Speech Coding, pages 165–167,
1999.
M. Charbit
Débruitage des signaux audio - 55/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
R. Martin, D. Malah, R. Cox, and A. Accardi.
A noise reduction preprocessor for mobile voice
communication.
EURASIP Journal on Applied Signal Processing,
8 :1046–1058, 2004.
L. Rabiner and R Schafer.
Digital Processing of Speech Signals.
Prentice-Hall, 1978.
Sundarrajan Rangachari and Philipos C. Loizou.
A noise-estimation algorithm for highly non-stationary
environments.
Speech Communication, vol. 48, pages 220–231, 2006.
M. Charbit
Débruitage des signaux audio - 56/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
R.Veldhuis.
Restoration of lost samples in digital signals.
Prentice-Hall, 1990.
N. Sasaoka, N. Sasaoka, K. Sumi, Y. Itoh, and K. Fujii.
A new noise reduction system based on ale and noise
reconstruction filter.
IEEE International Symposium on Circuits and Systems
(ISCAS), 1 :272–275, 2005.
N. Sasaoka, N. Sasaoka, M. Watanabe, Y. Itoh, and
K. Fujii.
Noise reduction system based on lpef and system
identification with variable step size.
IEEE International Symposium on Circuits and Systems
(ISCAS), pages 2311–2314, 2007.
M. Charbit
Débruitage des signaux audio - 57/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
P. Scarlat and J. Vieira.
Speech enhancement based on a priori signal to noise
estimation.
Inter. Conference on ASSP, pages 629–632, 1996.
B. Sim, Y. Tong, J. Chang J., and C. Tan.
A parametric formulation of the generalized spectral
subtraction method.
IEEE Transactions on Speech and Audio Processing, vol.
6, No. 4, pages 328–337, July 1998.
VAD.
Special issue on standardization and characterization of
g.729.
IEEE Communications Magazine, Sept. 1997.
M. Charbit
Débruitage des signaux audio - 58/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
P.D. Welch.
The use of fast fourier transform for the estimation of power
spectra : A method based on time averaging over short,
modified periodograms.
IEEE Transactions on Audio Electroacoustics, Volume
AU-15, pages 70–73, June 1967.
P. Wolfe and S. Godsill.
Simple alternatives to the ephraim and malah suppression
rule for speech enhancement.
11th IEEE Workshop on Statistical Signal Processing,
Singapore., pages 496–499, August 2001.
M. Charbit
Débruitage des signaux audio - 59/60
Introduction
Evaluation
Suppression des craquements
Suppression du bruit de fond
Modélisation des signaux
Algorithme d’Ephraïm et Malah
G. Yu, S. Mallat, and E. Bacry.
Audio denoising by time-frequency block thresholding.
IEEE Transactions on Signal Processing, 56 :1830–1839,
May 2008.
E. Zavarehei and S. Vaseghi.
Speech enhancement in temporal dft trajectories using
kalman filter.
Interspeech 2005 Lisbon, 2005.
M. Charbit
Débruitage des signaux audio - 60/60