TP_RCP208_fiche2

Transcription

TP_RCP208_fiche2

Reconnaissance des Formes et Méthodes Neuronales (RCP208)
2015-2016
Régression par perceptron multicouches
1
Chargement de la toolbox Netlab
Adresse de la Toolbox Netlab
http://www1.aston.ac.uk/eas/research/groups/ncrg/resources/netlab/downloads/
• Charger le fichier netlab3 3.tar en cliquant sur ”gzip file” de la Toolbox 3.3 (Date : 18/06/2004)
↩→ voir figure ci-dessous
• Charger aussi le fichier foptions.m
• décompresser le fichier netlab3 3.tar dans un un répertoire Netlab
↩→ sous linux : tar xvf netlab3 3.tar puis rm netlab3 3.tar
• déplacer le fichier foptions.m dans le répertoire Netlab
↩→ Vous disposez alors de la toolbox Netlab dans le répertoire Netlab.
1
2
Perceptron sans couche cachée
2.1
Les données
1. Ecrire (ou faire copier-coller) les instructions suivantes dans un fichier donnee1.m.
Fichier donnee1.m avec des commentaires
a=2; b=3; n=200;
a=2; b=3; n=200;
X=4*(rand(n,1)-.5); X=sort(X);
% n points triés par ordre croissant
Y=a*X+b;
X=4*(rand(n,1)-.5);
Yb=Y+.2*randn(size(Y,1),1);
X=sort(X);
figure
Y=a*X+b; % équation d’une droite
plot(X,Y,’b-’,X,Yb,’c.’)
Yb=Y+.2*randn(size(Y,1),1); % Yb : Y bruitée
legend(’: Y’,’: Yb’);
% Vidualisation (voir figure ci-dessous)
save data1 X Y Yb
figure
save data1 X Y Yb % sauvegarde
2. Placez-vous dans la fenêtre de commande Matlab et tapez donnee1 pour générer les données data1.mat
2.2
Apprentissage
1. Taper (ou faire copier-coller) les instructions suivantes dans un fichier perceptron1.m
global options
addpath Netlab
load data1
Xapp=X(1:2:end);
Yapp=Yb(1:2:end);
Xtest=X(2:2:end);
Ytest=Yb(2:2:end);
Net = glm(size(Xapp,2),size(Yapp,2),’linear’);
options
= foptions;
options(1) = 1;
options(14) = 100;
options(18) = 0.001;
[Net options errlog] = netopt(Net, options, Xapp, Yapp, ’graddesc’);
figure
plot(errlog)
Yc=glmfwd(Net,X);
figure
plot(X,Y,’b-’,X,Yc,’r-’)
legend(’: Y’,’: Yc’);
Etest=glmerr(Net,Xtest,Ytest)
2
Fichier perceptron1.m avec des commentaires
global options
addpath Netlab % À modifier selon l’emplacement de Netlab
% addpath : pour ajouter le chemin d’accès aux fonctions Netlab
% faire help addpath pour plus d’informations
load data1 % Chargement des données ( à modifier selon l’emplacement de data1)
Xapp=X(1:2:end); Yapp=Yb(1:2:end); % Base d’apprentissage
Xtest=X(2:2:end); Ytest=Yb(2:2:end); % Base de test
% Choix d’une architecture et initialisation des poids
Net = glm(size(Xapp,2),size(Yapp,2), ’linear’); % Taper Net pour voir le résultat
options = foptions; % vecteur contenant les paramètres d’apprentissage
options(1) = 1; % on active l’affichage des erreurs
options(14) = 100; % nombre de cycles d’apprentissage
options(18) = 0.001; % le pas d’apprentissage
% Apprentissage
% Vidualisation : voir les figures ci-dessus
figure
plot(errlog) % Variation de l’erreur durant l’apprentissage
Yc=glmfwd(Net,X); % Yc : sortie calculée par le perceptron Net (après apprentissage) pour l’entée X
figure
% Maintenant on va montrer :
% la droite d’équation Y= 2 X + 3 (celle qu’on veut apprendre) en utilisant la couleur bleu et
% Yc en utilisant la couleur rouge
% On va calculer l’erreur sur la base de test entre :
%
Ytest = 2*Xtest + 3 et Ytestcal=glmfwd(Net,Xtest)
% Ytestcal : sortie calculée par le perceptron Net (après apprentissage) pour l’entée Xtest
Etest=glmerr(Net,Xtest,Ytest)
2. Dans la fenêtre de commande Matlab, tapez perceptron1 pour faire un premier apprentissage
↩→ On obtient les 2 figures suivantes :
• En bleu la droite d’équation : Y=a∗X+b
↩→ (avec a=2 et b=3 voir fichier donnee1.m)
• En rouge la droite d’équation :
Yc = Net.w1∗X + Net.b1
↩→ équation de le droite apprise par le réseau
Variation de l’erreur durant l’apprentissage
◃ Taper Net.w1 puis Net.b1
↩→ Comparer Net.w1 avec a (a=2 dans le fichier donnee1.m)
↩→ Comparer Net.b1 avec b (b=3 dans le fichier donnee1.m)
◃ Pour voir les autres champs de la structure Net, taper Net dans la fenêtre de commande Matlab
3. Faire d’autres apprentissages :
(a) Faire varier le pas d’apprentissage (options(18))
(b) Faire varier le nombre de cycles d’apprentissage (options(14))
3
3
Perceptron multicouches
3.1
Les données
1. Ecrire (ou faire copier-coller) les instructions ci-dessous dans un fichier donnee2.m.
2. Placez-vous dans la fenêtre de commande Matlab et tapez donnee2 pour générer les données data2.mat
↩→ on obtient la figure suivante :
n=1000;
X=4*(rand(n,1)-.5);
X=sort(X);
Y=zeros(size(X));
Y=Y+sin(pi*X).*((X>-1) & (X<1));
Yb=Y+.1*randn(size(Y,1),1);
figure
title(’data2’)
save data2 X Y Yb
3.2
Base d’apprentissage et base de test
1. Ecrire (copier-coller) la fonction suivante dans un fichier GetSample.m
function [Xa,Ya]=GetSamples(N,X,Y)
fprintf(’\n Cliquez %d points dans la figure \n’,N*2)
[xval, yval]=ginput(2*N);
for i=1:2*N
[val(i) x(i)]=min(abs(xval(i)-X));
end
x(2*N+1)=length(X);
Xa=[];Ya=[];
k=1;
for i=1:N
Xa=[Xa;X((x(k)+1):x(k+1))];
Ya=[Ya;Y((x(k)+1):x(k+1))];
k=k+2;
end
drawnow
2. Ecrire (copier-coller) les instructions suivantes dans un fichier GereneBases.m
load data2;
figure
plot(X,Yb,’b.’)
hold on
grid on
NbreblocksApp=4;
[Xapp,Yapp]=GetSamples(NbreblocksApp,X,Yb);
plot(Xapp,Yapp,’ro’)
NbreblocksTest=3;
[Xtest,Ytest]=GetSamples(NbreblocksTest,X,Yb);
plot(Xtest,Ytest,’go’)
legend(’: donnees de depart’, ’donnees apprentissage’,’:donnees test’)
save base1 X Y Yb Xapp Yapp Xtest Ytest
4
3. Placez-vous dans la fenêtre de commande Matlab et tapez la commande suivante : GenereBases
(a) D’abord il faut cliquer 8 fois sur la figure pour choisir les données d’apprentissage (4 blocs)
Explications : dans le fichier GereneBases.m on a choisi NbreblocksApp=4 (4 blocs de données).
2 cliques consécutifs =⇒ un bloc de données
↩→ Donc il faut cliquer : 2 * NbreblocksApp
= 2 * 4 = 8 fois
Par exemple la figure suivante montre les données
choisies pour l’apprentissage : les 4 blocs rouges
(b) Ensuite il faut cliquer 6 fois sur la figure pour choisir les données test (3 blocs).
Dans le fichier GereneBases.m on a choisi NbreblocksTest=3 =⇒ 3 blocs de données
↩→ Donc il faut cliquer : 2 * NbreblocksTest = 2 * 3 = 6 fois
Par exemple la figure suivante montre :
- les données choisies pour l’apprentissage
↩→ les 4 blocs rouges
- les données choisies pour le test
↩→ les 3 blocs verts.
3.3
Apprentissage
Utiliser les instructions suivantes pour l’apprentissage
global options
addpath Netlab
figure
load base1
NbreNC = 10; % Nombre de neurones dans la couche cachée
Net = mlp(size(Xapp,2), NbreNC, size(Yapp,2), ’linear’);
options = foptions;
options(1) = 1; options(14) = 100; options(18) = 0.001;
figure
plot(errlog)
Yc=mlpfwd(Net,X);
figure
Etest=mlperr(Net,Xtest,Ytest);
1.
2.
3.
4.
Faire varier le pas d’apprentissage (options(18))
Faire varier le nombre de cycles d’apprentissage (options(14))
Faire varier le nombre de neurones dans la couche cachée
Générer de nouveaux ensembles d’apprentissage.
Exemple : cacher les parties importantes de la fonction
(comme sur la figure)
5
Fonctions importantes de Netlab pour un perceptron multicouches
• mlp.m : permet de définir une architecture et d’initialiser les poids.
.
.
.
.
Net = mlp(ne, nc, ns,fsortie);
ne : nombre de neurones en entrée (c’est la dimension des entrées).
nc : nombre de neurones cachés.
ns : nombre de neurones en sortie (c’est la dimension des sorties).
fsortie : fonction d’activation pour la couche de sortie
↩→ fsortie = ’linear’, ’logistic’ ou ’softmax’
↩→ Faire help mlp pour plus de détails.
• netopt.m : permet d’effectuer l’apprentissage
en utilisant l’algorithme de rétropropagation du gradient.
.
.
.
.
.
.
[Net, options] = netopt(Net, options, Xapp, Yapp, alg);
Net : architecture du réseau (avec les poids)
(Xapp,Yapp) : base d’apprentissage (couples entre-sortie)
options(1) : permet d’activer (ou désactiver) l’affichage des erreurs.
options(14) : nombre de cycles d’apprentissage
options(18) : le pas d’appretissage
alg : algorithme d’apprentissage (d’optimisation)
↩→ alg = ’graddesc’, ’scg’ ,’conjgrad’ ou ’quasinew’
↩→ Faire help netopt pour plus de détails.
• mlpfwd : permet de calculer la sortie d’un réseau pour une entrée donnée
Ytestcal = mlpfwd(Net, Xtest);
. Net : architecture du réseau (avec les poids)
. Ytestcal : sortie calculée par le réseau Net pour l’entrée Xtest.
Ensuite il faut comparer Ytest avec Ytestcal.
↩→ Ytest : la sortie désirée pour l’entrée Xtest
Remarque :
• L’apprentissage avec l’algorithme ’graddesc’ dépend fortement de la valeur donnée au pas d’apprentissage
options(18).
• Les algorithmes du deuxième ordre ’scg’ ,’conjgrad’ et ’quasinew’ utilisent les dérivées secondes de
la fonction de coût pour pouvoir calculer les pas d’apprentissage optimaux (donc ’scg’ ,’conjgrad’ et
’quasinew’ n’utilisent pas options(18)).
• Dorénavant vous pouvez utiliser l’algorithme ’scg’ à la place de ’graddesc’
Nous reviendrons sur les algorithmes de deuxième ordre ainsi que sur les autres paramètres
du vecteur options dans le cadre de l’UE RCP209 (qui fait suite à l’UE RCP208) .
6
Fonction d’activation des neurones de sortie : ’linear’, ’logistic’ ou ’softmax’
Dans Netlab l’architecture est limitée à une seule couche cachée.
• La fonction d’activation des neurones cachés est une tangente hyperbolique.
• Pour les neurones de la couche de sortie, la fonction d’activation peut être :
linéaire (’linear’),
logistique (’logistic’) ou
softmax (’softmax’).
Fonction d’activation (voir les instructions de mlpfwd.m de Netlab)
• Pour un problème de régression
il vaut mieux utiliser une fonction d’activation linéaire à la couche de sortie
• Pour un problème de classification
il vaut mieux utiliser des fonctions d’activation non linéaires (’logistic’ ou ’softmax’) à la couche de sortie.
↩→ Quand on utilise la fonction d’activation ’softmax’ la somme des sorties est égaleà 1.
↩→ On peut ainsi interpréter les sorties du réseau comme des probabilités que l’entrée appartienne
à chacune des classes.
7
4
Un problème réel de régression : le problème ”sunspot”
Il s’agit du nombre moyen annuel de taches noires observées sur le soleil entre 1700 et 1979 (280 points). La
série des taches solaires est très courte et célèbre dont l’équation sous jacente est inconue.
La figure ?? montre l’évolution annuelle de cette série.
1
0.9
0.8
Average sunspot activity
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1700
1750
1800
1850
Year
1900
1950
2000
Figure 1: série sunspot normalisée de 1700 à 1979.
Pour ce problème, on essaie de prédire une valeur en utilisant les 12 valeurs précédentes.
Nous allons donc utiliser un réseau avec une couche d’entrée de 12 neurones (ne = 12) et une couche de sortie
de 1 neurone (ns = 1) (voir la figure suivante).
PMC
valeur
prédite
contexte
On utilise les données de 1712 à 1920 pour l’apprentissage (un ensemble DApp de 209 exemples),
et les données de 1921 à 1955 pour la validation (un ensemble DV al de 35 exemples). Pour le test, on
utilise les données de 1956 à 1979 (un ensemble DT est de 24 exemples).
Mesure de qualité
Les performances du modèle sont calculées en utilisant le critère ARV (”Average Relative Variance”), qui est
le rapport entre l’erreur quadratique moyenne du modèle et la variance des données. La définition de l’ARV
établit un rapport entre l’erreur du modèle et la variance des données calculée sur le même ensemble D (pris
de l’ensemble entier S).
Cependant, la définition de l’ARV la plus utilisée utilise la variance totale des données (de la série).
∑
1
(y i − f (xi ))2
|D|
arv(D) =
i∈D
∑
1
(y i
|S|
i∈S
− µS )2
(1)
où y i est la valeur de la série à l’instant i, f (xi ) est la sortie du réseau à l’instant i, et µS la moyenne de la
valeur désirée dans S (la série entière) .
Afin de pouvoir comparer vos résultats avec ceux obtenus en utilisant d’autres méthodes, utilisez cette formule.
8
1. Télécharger le fichier DonneesSunspots (DonneesSunspots.zip )
http://deptinfo.cnam.fr/new/spip.php?article851
2. Constituer les ensembles DApp , DV al et DT est
Vous pouvez utiliser les instructions suivantes :
↩→ Pour plus de détails −→ voir Exercice 2 du TP1 (Initiation à Matlab)
data = load(’Sunspots’);
dataSunspots=data(:,2);
% Data input
Entree(:,1)=dataSunspots(1:268);
% Data output
Sortie=dataSunspots(13:280);
% Bases : Apprentissage, Validation et Test
DappInput=Entree(1:209,:);
% Learning input
DappOutput=Sortie(1:209);
% Learning output
DvalInput=Entree(210:244,:); % Validation input
DvalOutput=Sortie(210:244);
% Validation output
DtestInput=Entree(245:268,:); % Test input
DtestOutput=Sortie(245:268); % Test output
• Pour faire un premier test, vous pouvez lancer un apprentissage en utilisant les instructions suivantes :
nbre_neur_entree = size(DappInput,2);
nbre_neur_sortie = size(DappOutput,2);
nbre_neur_cache = 10;
Net = mlp(nbre_neur_entree, nbre_neur_cache, nbre_neur_sortie, ’linear’);
options
= foptions;
options(1) = 1;
options(14) = 1000;
algorithm = ’scg’;
[Net, options] = netopt(Net, options, DappInput, DappOutput, algorithm);
9
• DApp (ensemble d’apprentissage) : il sert à calculer les poids du réseau.
• DV al (ensemble de validation) : il sert à éviter le sur-apprentissage
↩→ à déterminer quand arrêter l’apprentissage.
• DT est (ensemble de test) : il sert à évaluer les performances du résau obtenu.
↩→ Cet ensemble ne doit pas intervenir ni pour la détermination des poids ni pour l’arrêt de l’apprentissage.
Early stopping (stopper l’apprentissage avant convergence)
• Il faut utiliser DApp pour calculer les poids du réseau
↩→ L’erreur sur DApp décroı̂t puis se stabilise
• Il faut utiliser DV al pour déterminer quand arrêter l’apprentissage
↩→ L’erreur sur DV al passe par un minimum avant de croı̂tre.
• A la fin de l’apprentissage,
↩→ il faut utiliser DT est pour évaluer les performances du réseau obtenu.
3. Utiliser un réseau avec une couche cachée pour faire des apprentissages (utiliser le ”early stopping” pour
arrêter l’apprentissage).
4. Quels sont les paramètres qui vous ont permis d’obtenir les meilleures performances sur l’ensemble de
test (DT est ).
10

TP_RCP208_fiche2

Transcription

Documents pareils

Affiche du Concert

plan d`installation pagode de vincennes - Tibet

Brasserie du Sillon St Sylvestre - Office de Tourisme de Saint-Malo

Apprentissage, Réseaux de neurones et Mod`eles graphiques

espace sante jeunes espace sante jeunes

4 OCTOBRE 2015 MINIATURES AUTOMOBILES ET JOUETS

entree - Modhac

Communiqué GAMME DE SOINS de Juin 2010

Chants sacrés à voix d`enfants

Machines `a vecteurs support (SVM) Chargement de la Toolbox